توضیحاتی در مورد کتاب Bitext Alignment (Synthesis Lectures on Human Language Technologies)
نام کتاب : Bitext Alignment (Synthesis Lectures on Human Language Technologies)
ویرایش : 1
عنوان ترجمه شده به فارسی : تراز بیت متن (سخنرانی ترکیبی در مورد فن آوری های زبان انسانی)
سری :
نویسندگان : Jörg Tiedemann
ناشر : Morgan & Claypool Publishers
سال نشر : 2011
تعداد صفحات : 167
ISBN (شابک) : 1608455106 , 9781608455102
زبان کتاب : English
فرمت کتاب : pdf
حجم کتاب : 3 مگابایت
بعد از تکمیل فرایند پرداخت لینک دانلود کتاب ارائه خواهد شد. درصورت ثبت نام و ورود به حساب کاربری خود قادر خواهید بود لیست کتاب های خریداری شده را مشاهده فرمایید.
توضیحاتی در مورد کتاب :
این کتاب مروری بر تکنیکهای مختلف برای همترازی متنهای بیتی ارائه میکند. مفاهیم و استراتژیهای کلی را توصیف میکند که میتواند برای نقشهبرداری از بخشهای متناظر در اسناد موازی در سطوح مختلف دانهبندی استفاده شود. بیت متن ها منابع زبانی ارزشمندی برای بسیاری از زمینه های تحقیقاتی مختلف و کاربردهای عملی هستند. غالب ترین کاربرد، ترجمه ماشینی، به ویژه، ترجمه ماشینی آماری است. با این حال، موضوعات مختلف دیگری وجود دارد که می توان آنها را دنبال کرد که ممکن است توسط دانش غنی زبانی که به طور ضمنی در منابع موازی ذخیره شده است پشتیبانی شود. بیتمتنها در فرهنگنویسی، ابهامزدایی از معنای کلمه، استخراج اصطلاحات، یادگیری زبان به کمک رایانه و مطالعات ترجمه مورد بررسی قرار گرفتهاند. این کتاب وظایف اساسی را پوشش می دهد که باید هنگام ساخت مجموعه های موازی انجام شود، از مجموعه اسناد ترجمه شده تا ترازهای فرعی. به طور خاص، رویکردهای مختلفی را برای تراز کردن اسناد، تراز جملات، تراز کلمات و تراز ساختار درختی توصیف می کند. همچنین شامل فهرستی از منابع و مروری جامع از ادبیات تکنیک های هم ترازی است. فهرست مطالب: مقدمه / مفاهیم و اصطلاحات اساسی / ساخت بدنه های موازی / تراز جملات / تراز کلمات / تراز عبارات و درخت / نکات پایانی
فهرست مطالب :
Preface......Page 11
Acknowledgments......Page 13
Introduction......Page 15
Applications......Page 19
Further Readings......Page 20
Bitext and Alignment......Page 21
Alignment and Segmentation......Page 23
Alignment Spaces and Constraints......Page 25
Correlations and Cues......Page 29
Alignment Models and Search Algorithms......Page 31
Evaluation of Bitext Alignment......Page 35
Summary and Further Reading......Page 37
Building Parallel Corpora......Page 41
Document Alignment......Page 43
Mining the Web......Page 46
Extracting Parallel Data from Comparable Corpora......Page 48
Summary and Further Reading......Page 49
Sentence Alignment......Page 51
Length-based Approaches......Page 52
Lexical Matching Approaches......Page 62
Combined and Resource-Specific Techniques......Page 67
Summary and Further Reading......Page 70
Word Alignment......Page 73
Generative Alignment Models......Page 74
Constraints and Heuristics......Page 89
Discriminative Alignment Models......Page 95
Translation Spotting and Bilingual Lexicon Induction......Page 113
Summary and Further Reading......Page 117
Phrase and Tree Alignment......Page 119
Parallel Treebanks and Tree alignment......Page 120
Hierarchical Alignment and Transduction Grammars......Page 125
Summary and Further Reading......Page 135
Concluding Remarks......Page 137
Final Recommendations......Page 138
Resources & Tools......Page 139
Bibliography......Page 143
Author's Biography......Page 167
توضیحاتی در مورد کتاب به زبان اصلی :
This book provides an overview of various techniques for the alignment of bitexts. It describes general concepts and strategies that can be applied to map corresponding parts in parallel documents on various levels of granularity. Bitexts are valuable linguistic resources for many different research fields and practical applications. The most predominant application is machine translation, in particular, statistical machine translation. However, there are various other threads that can be followed which may be supported by the rich linguistic knowledge implicitly stored in parallel resources. Bitexts have been explored in lexicography, word sense disambiguation, terminology extraction, computer-aided language learning and translation studies to name just a few. The book covers the essential tasks that have to be carried out when building parallel corpora starting from the collection of translated documents up to sub-sentential alignments. In particular, it describes various approaches to document alignment, sentence alignment, word alignment and tree structure alignment. It also includes a list of resources and a comprehensive review of the literature on alignment techniques. Table of Contents: Introduction / Basic Concepts and Terminology / Building Parallel Corpora / Sentence Alignment / Word Alignment / Phrase and Tree Alignment / Concluding Remarks