Bitext Alignment (Synthesis Lectures on Human Language Technologies)

دانلود کتاب Bitext Alignment (Synthesis Lectures on Human Language Technologies)

35000 تومان موجود

کتاب تراز بیت متن (سخنرانی ترکیبی در مورد فن آوری های زبان انسانی) نسخه زبان اصلی

دانلود کتاب تراز بیت متن (سخنرانی ترکیبی در مورد فن آوری های زبان انسانی) بعد از پرداخت مقدور خواهد بود
توضیحات کتاب در بخش جزئیات آمده است و می توانید موارد را مشاهده فرمایید


این کتاب نسخه اصلی می باشد و به زبان فارسی نیست.


امتیاز شما به این کتاب (حداقل 1 و حداکثر 5):

امتیاز کاربران به این کتاب:        تعداد رای دهنده ها: 2


توضیحاتی در مورد کتاب Bitext Alignment (Synthesis Lectures on Human Language Technologies)

نام کتاب : Bitext Alignment (Synthesis Lectures on Human Language Technologies)
ویرایش : 1
عنوان ترجمه شده به فارسی : تراز بیت متن (سخنرانی ترکیبی در مورد فن آوری های زبان انسانی)
سری :
نویسندگان :
ناشر : Morgan & Claypool Publishers
سال نشر : 2011
تعداد صفحات : 167
ISBN (شابک) : 1608455106 , 9781608455102
زبان کتاب : English
فرمت کتاب : pdf
حجم کتاب : 3 مگابایت



بعد از تکمیل فرایند پرداخت لینک دانلود کتاب ارائه خواهد شد. درصورت ثبت نام و ورود به حساب کاربری خود قادر خواهید بود لیست کتاب های خریداری شده را مشاهده فرمایید.

توضیحاتی در مورد کتاب :


این کتاب مروری بر تکنیک‌های مختلف برای هم‌ترازی متن‌های بیتی ارائه می‌کند. مفاهیم و استراتژی‌های کلی را توصیف می‌کند که می‌تواند برای نقشه‌برداری از بخش‌های متناظر در اسناد موازی در سطوح مختلف دانه‌بندی استفاده شود. بیت متن ها منابع زبانی ارزشمندی برای بسیاری از زمینه های تحقیقاتی مختلف و کاربردهای عملی هستند. غالب ترین کاربرد، ترجمه ماشینی، به ویژه، ترجمه ماشینی آماری است. با این حال، موضوعات مختلف دیگری وجود دارد که می توان آنها را دنبال کرد که ممکن است توسط دانش غنی زبانی که به طور ضمنی در منابع موازی ذخیره شده است پشتیبانی شود. بیت‌متن‌ها در فرهنگ‌نویسی، ابهام‌زدایی از معنای کلمه، استخراج اصطلاحات، یادگیری زبان به کمک رایانه و مطالعات ترجمه مورد بررسی قرار گرفته‌اند. این کتاب وظایف اساسی را پوشش می دهد که باید هنگام ساخت مجموعه های موازی انجام شود، از مجموعه اسناد ترجمه شده تا ترازهای فرعی. به طور خاص، رویکردهای مختلفی را برای تراز کردن اسناد، تراز جملات، تراز کلمات و تراز ساختار درختی توصیف می کند. همچنین شامل فهرستی از منابع و مروری جامع از ادبیات تکنیک های هم ترازی است. فهرست مطالب: مقدمه / مفاهیم و اصطلاحات اساسی / ساخت بدنه های موازی / تراز جملات / تراز کلمات / تراز عبارات و درخت / نکات پایانی

فهرست مطالب :


Preface......Page 11
Acknowledgments......Page 13
Introduction......Page 15
Applications......Page 19
Further Readings......Page 20
Bitext and Alignment......Page 21
Alignment and Segmentation......Page 23
Alignment Spaces and Constraints......Page 25
Correlations and Cues......Page 29
Alignment Models and Search Algorithms......Page 31
Evaluation of Bitext Alignment......Page 35
Summary and Further Reading......Page 37
Building Parallel Corpora......Page 41
Document Alignment......Page 43
Mining the Web......Page 46
Extracting Parallel Data from Comparable Corpora......Page 48
Summary and Further Reading......Page 49
Sentence Alignment......Page 51
Length-based Approaches......Page 52
Lexical Matching Approaches......Page 62
Combined and Resource-Specific Techniques......Page 67
Summary and Further Reading......Page 70
Word Alignment......Page 73
Generative Alignment Models......Page 74
Constraints and Heuristics......Page 89
Discriminative Alignment Models......Page 95
Translation Spotting and Bilingual Lexicon Induction......Page 113
Summary and Further Reading......Page 117
Phrase and Tree Alignment......Page 119
Parallel Treebanks and Tree alignment......Page 120
Hierarchical Alignment and Transduction Grammars......Page 125
Summary and Further Reading......Page 135
Concluding Remarks......Page 137
Final Recommendations......Page 138
Resources & Tools......Page 139
Bibliography......Page 143
Author's Biography......Page 167

توضیحاتی در مورد کتاب به زبان اصلی :


This book provides an overview of various techniques for the alignment of bitexts. It describes general concepts and strategies that can be applied to map corresponding parts in parallel documents on various levels of granularity. Bitexts are valuable linguistic resources for many different research fields and practical applications. The most predominant application is machine translation, in particular, statistical machine translation. However, there are various other threads that can be followed which may be supported by the rich linguistic knowledge implicitly stored in parallel resources. Bitexts have been explored in lexicography, word sense disambiguation, terminology extraction, computer-aided language learning and translation studies to name just a few. The book covers the essential tasks that have to be carried out when building parallel corpora starting from the collection of translated documents up to sub-sentential alignments. In particular, it describes various approaches to document alignment, sentence alignment, word alignment and tree structure alignment. It also includes a list of resources and a comprehensive review of the literature on alignment techniques. Table of Contents: Introduction / Basic Concepts and Terminology / Building Parallel Corpora / Sentence Alignment / Word Alignment / Phrase and Tree Alignment / Concluding Remarks



پست ها تصادفی