توضیحاتی در مورد کتاب :
گزارش علمی، دانشگاه کمبریج، 1997. — 71 p.
در این گزارش، مقدمه ای بر مدل سازی زبان طبیعی در زمینه تشخیص گفتار ارائه شده است. تکنیکهای مختلفی برای فرمولبندی مدلهای زبان تصادفی مورد بحث قرار گرفتهاند، که بهویژه بر مدلهای N-gram بر اساس کلاسهای کلمات تمرکز میکنند. ارائه تعدادی از تکنیک های آماری برای طبقه بندی خودکار کلمات ارائه شده است. نتایج برای دو تکنیک خوشه بندی خودکار همراه با یادداشت هایی در مورد اجرای آنها در مدل های زبان سطح کلاس ارائه شده است. این نتایج با تعدادی از مدلهای سطح کلمه مقایسه میشوند. در نهایت، بخشی در مورد جهتی که تحقیقات بعدی در آن توسعه خواهد یافت، گنجانده شده است.
مقدمه
مدل سازی زبان
تکنیک های طبقه بندی خودکار
نتایج
برنامه هایی برای تحقیقات بیشتر
آمار N-gram برای سه اندازه Wall-Street Journal Corpora
الگوریتم B برای بازآرایی کلمات
C به روز رسانی معادلات پیاده سازی شده برای الگوریتم تپه نوردی< br/>D معادلات بهروزرسانی برای بازآراییهای چندگانه کلمه به خوشه اجرا شده است
روش تجربی E
F منابع متنی زبان روسی
توضیحاتی در مورد کتاب به زبان اصلی :
Scientific Report, University of Cambridge, 1997. — 71 p.
In this report, an introduction to natural language modelling is given in the context of speech recognition. Various techniques for formulating stochastic language models are discussed, focusing particularly on N-gram models based on classes of words. A presentation of a number of statistical techniques for the automatic classification of words is given. Results for two automatic clustering techniques are presented along with notes on their implementation in class-level language models. These results are compared with a number of word-level models. Finally, a section on the direction in which subsequent research will develop is included.
Introduction
Language Modelling
Automatic Classification Techniques
Results
Plans for Further investigation
A N-gram Statistics for three sizes of Wall-Street Journal Corpora
B Algorithm for word rearrangements
C Update equations implemented for hill-climbing algorithm
D Update equations implemented for multiple word-to-cluster rearrangements
E Experimental Method
F Russian language text sources