Automatic Speech Recognition: The Development of the SPHINX System

دانلود کتاب Automatic Speech Recognition: The Development of the SPHINX System

46000 تومان موجود

کتاب تشخیص خودکار گفتار: توسعه سیستم SPHINX نسخه زبان اصلی

دانلود کتاب تشخیص خودکار گفتار: توسعه سیستم SPHINX بعد از پرداخت مقدور خواهد بود
توضیحات کتاب در بخش جزئیات آمده است و می توانید موارد را مشاهده فرمایید


این کتاب نسخه اصلی می باشد و به زبان فارسی نیست.


امتیاز شما به این کتاب (حداقل 1 و حداکثر 5):

امتیاز کاربران به این کتاب:        تعداد رای دهنده ها: 8


توضیحاتی در مورد کتاب Automatic Speech Recognition: The Development of the SPHINX System

نام کتاب : Automatic Speech Recognition: The Development of the SPHINX System
ویرایش : 1
عنوان ترجمه شده به فارسی : تشخیص خودکار گفتار: توسعه سیستم SPHINX
سری : The Springer International Series in Engineering and Computer Science 62
نویسندگان :
ناشر : Springer US
سال نشر : 1989
تعداد صفحات : 215
ISBN (شابک) : 9781461366249 , 9781461536505
زبان کتاب : English
فرمت کتاب : pdf
حجم کتاب : 17 مگابایت



بعد از تکمیل فرایند پرداخت لینک دانلود کتاب ارائه خواهد شد. درصورت ثبت نام و ورود به حساب کاربری خود قادر خواهید بود لیست کتاب های خریداری شده را مشاهده فرمایید.

توضیحاتی در مورد کتاب :




تشخیص گفتار سابقه طولانی دارد که یکی از مشکلات دشوار در هوش مصنوعی و علوم کامپیوتر است. زمانی که فرد از تکالیف حل مسئله مانند پازل و شطرنج به کارهای ادراکی مانند گفتار و بینایی می‌رود، ویژگی‌های مسئله به‌طور چشمگیری تغییر می‌کند: دانش ضعیف به دانش غنی. نرخ داده کم به نرخ داده بالا; زمان پاسخ آهسته (دقیقه تا ساعت) تا زمان پاسخ آنی. این ویژگی ها در کنار هم پیچیدگی محاسباتی مسئله را با چندین مرتبه بزرگی افزایش می دهند. علاوه بر این، گفتار یک حوزه کاری چالش برانگیز را فراهم می کند که بسیاری از الزامات رفتار هوشمندانه را در بر می گیرد: کار در زمان واقعی. بهره برداری از حجم وسیعی از دانش، تحمل ورودی ناشناخته اشتباه و غیرمنتظره؛ از نمادها و انتزاعات استفاده کنید. به زبان طبیعی ارتباط برقرار کنید و از محیط بیاموزید. ورودی صوتی به رایانه دارای مزایای متعددی است. این یک رسانه ورودی طبیعی، سریع، بدون دست، بدون چشم و بدون موقعیت مکانی را فراهم می کند. با این حال، بسیاری از مشکلات هنوز حل نشده وجود دارد که مانع استفاده معمول از گفتار به عنوان یک دستگاه ورودی توسط افراد غیر متخصص می شود. اینها شامل هزینه، پاسخ در زمان واقعی، استقلال گوینده، استحکام در برابر تغییراتی مانند نویز، میکروفون، سرعت گفتار و بلندی صدا، و توانایی مدیریت گفتار غیر دستوری است. راه حل های رضایت بخشی برای هر یک از این مشکلات در دهه آینده قابل انتظار است. تشخیص گفتار پیوسته خود به خود نامحدود در حال حاضر غیرقابل حل به نظر می رسد. با این حال، با افزودن محدودیت‌های ساده، مانند گفتگوی شفاف‌سازی برای رفع ابهام، ما معتقدیم که می‌توان سیستم‌هایی را توسعه داد که قادر به پذیرش واژگان بسیار وسیع واژگان مستمر هستند.


فهرست مطالب :


Front Matter....Pages i-xv
Introduction....Pages 1-16
Hidden Markov Modeling of Speech....Pages 17-43
Task and Databases....Pages 45-50
The Baseline SPHINX System....Pages 51-62
Adding Knowledge....Pages 63-89
Finding a Good Unit of Speech....Pages 91-114
Learning and Adaptation....Pages 115-127
Summary of Results....Pages 129-136
Conclusion....Pages 137-144
Back Matter....Pages 145-207

توضیحاتی در مورد کتاب به زبان اصلی :


Speech Recognition has a long history of being one of the difficult problems in Artificial Intelligence and Computer Science. As one goes from problem solving tasks such as puzzles and chess to perceptual tasks such as speech and vision, the problem characteristics change dramatically: knowledge poor to knowledge rich; low data rates to high data rates; slow response time (minutes to hours) to instantaneous response time. These characteristics taken together increase the computational complexity of the problem by several orders of magnitude. Further, speech provides a challenging task domain which embodies many of the requirements of intelligent behavior: operate in real time; exploit vast amounts of knowledge, tolerate errorful, unexpected unknown input; use symbols and abstractions; communicate in natural language and learn from the environment. Voice input to computers offers a number of advantages. It provides a natural, fast, hands free, eyes free, location free input medium. However, there are many as yet unsolved problems that prevent routine use of speech as an input device by non-experts. These include cost, real time response, speaker independence, robustness to variations such as noise, microphone, speech rate and loudness, and the ability to handle non-grammatical speech. Satisfactory solutions to each of these problems can be expected within the next decade. Recognition of unrestricted spontaneous continuous speech appears unsolvable at present. However, by the addition of simple constraints, such as clarification dialog to resolve ambiguity, we believe it will be possible to develop systems capable of accepting very large vocabulary continuous speechdictation.




پست ها تصادفی