دسته: فن آوری
دانلود کتاب گنجاندن منابع دانش در تشخیص آماری گفتار بعد از پرداخت مقدور خواهد بود
توضیحات کتاب در بخش جزئیات آمده است و می توانید موارد را مشاهده فرمایید
نام کتاب : Incorporating Knowledge Sources into Statistical Speech Recognition
ویرایش : 1
عنوان ترجمه شده به فارسی : گنجاندن منابع دانش در تشخیص آماری گفتار
سری : Lecture Notes in Electrical Engineering 42
نویسندگان : Wolfgang Minker, Satoshi Nakamura, Konstantin Markov, Sakriani Sakti (auth.)
ناشر : Springer US
سال نشر : 2009
تعداد صفحات : 206
ISBN (شابک) : 9780387858296 , 9780387858302
زبان کتاب : English
فرمت کتاب : pdf
حجم کتاب : 2 مگابایت
بعد از تکمیل فرایند پرداخت لینک دانلود کتاب ارائه خواهد شد. درصورت ثبت نام و ورود به حساب کاربری خود قادر خواهید بود لیست کتاب های خریداری شده را مشاهده فرمایید.
تلفیق منابع دانش در تشخیص گفتار آماری راهحلهایی را برای افزایش استحکام سیستم تشخیص گفتار خودکار آماری (ASR) با ترکیب منابع مختلف دانش اضافی و در عین حال امکانپذیر نگه داشتن تلاش آموزشی و شناسایی ارائه میدهد. .
نویسندگان یک چارچوب کلی کارآمد برای ترکیب منابع دانش در سیستمهای آماری ASR پیشرفته ارائه میکنند. این چارچوب که GFIKS (چارچوب گرافیکی برای ترکیب منابع دانش اضافی) نامیده می شود، با استفاده از مفهوم شبکه بیزی (BN) طراحی شده است. این چارچوب اجازه می دهد تا روابط احتمالی بین منابع اطلاعاتی مختلف آموخته شود، انواع مختلفی از منابع دانش گنجانده شود، و تابع احتمالی مدل فرموله شود.
تلفیق منابع دانش در تشخیص گفتار آماری نشان میدهد که چگونه سیستم تشخیص گفتار آماری ممکن است منابع اطلاعاتی اضافی را با استفاده از GFIKS در سطوح مختلف ASR ترکیب کند. ادغام منابع مختلف دانش، از جمله نویزهای پس زمینه، لهجه، جنسیت و اطلاعات دانش آوایی گسترده، در مدل سازی به صورت نظری مورد بحث قرار گرفته و به صورت تجربی تجزیه و تحلیل می شود.
Incorporating Knowledge Sources into Statistical Speech Recognition offers solutions for enhancing the robustness of a statistical automatic speech recognition (ASR) system by incorporating various additional knowledge sources while keeping the training and recognition effort feasible.
The authors provide an efficient general framework for incorporating knowledge sources into state-of-the-art statistical ASR systems. This framework, which is called GFIKS (graphical framework to incorporate additional knowledge sources), was designed by utilizing the concept of the Bayesian network (BN) framework. This framework allows probabilistic relationships among different information sources to be learned, various kinds of knowledge sources to be incorporated, and a probabilistic function of the model to be formulated.
Incorporating Knowledge Sources into Statistical Speech Recognition demonstrates how the statistical speech recognition system may incorporate additional information sources by utilizing GFIKS at different levels of ASR. The incorporation of various knowledge sources, including background noises, accent, gender and wide phonetic knowledge information, in modeling is discussed theoretically and analyzed experimentally.