توضیحاتی در مورد کتاب :
Издательство Mouton de Gruyter, 1997, -1675 pp.
تولید فنی این کتاب راهنما یک تلاش مشترک توسط چندین گروه با مشارکت تعداد زیادی از افراد بوده است و موفقیت فرآیند هماهنگی به خودی خود به هیچ وجه کم اهمیت ترین نتیجه گروه کاری زبان گفتاری EAGLES نیست (به فصل «راهنمای کاربر» مراجعه کنید)، با اعتبار ویژه برای اعضای گروه تحریریه، راجر مور و ریچارد وینسکی، سبک الهام بخش و حمایت کننده از همکاری.
گروه اول شامل نویسندگان فنی است. همه آنها به خاطر صبر و همکاریشان، علیرغم برنامه ریزی های بیش از حد، مسئولیت های سنگین و در بسیاری موارد، نیاز به یادگیری لاتک در این فرآیند، شایسته تشکر هستند.
گروه دوم شامل تیم پشتیبانی EAGLES، به ویژه سازمان دهندگان در پیزا، آنتونیو زامپولی و نیکولتا کالزولاری، با تلاش های خستگی ناپذیر خود برای هماهنگ کردن گروهی از کارشناسان تا حدودی سرکش. Jock McNaught تخصص ویراستاری خود را در انتشارات الکترونیکی به کار برد تا بر روی طرح اولیه طرحبندی، و راهحلهایی برای بسیاری از مشکلات خاردار اعمال کند.
گروه سوم شامل تیم من در بیلهفلد، بهویژه اینگه مرتینز است که مقدار زیادی هزینه کرده است. کار تحقیق در مورد منابع، قالببندی مجدد از انواع فرمتهای منبع، مراقبت از بستههای سبک پیچیده و صرف ماه به ماه به آرامی و به طور مؤثر برای ترغیب نویسندگان مختلف برای ارائه متن، گرافیک و فرمول خوانا. تورستن بومبرگ دانش تخصصی خود را در مورد برنامه نویسی سیستم های یونیکس به ارمغان آورد تا بسیاری از مشکلات فنی را حل کند. او که متوجه شد نرم افزار موجود برای رسیدگی به سندی با اندازه و پیچیدگی این کتاب راهنما بزرگ نمی شود، یک استراتژی تبدیل LaTeX به HTML را مشخص و پیاده سازی کرد که جواب داد و نتایج خود را با توسعه دهندگان نرم افزار latex2html به اشتراک گذاشت که در نتیجه نرم افزار بهتری ایجاد شد. . هولگر اولریش نورد و تورستن تریپل نسخه اصلاح شده را در HTML دوباره قالببندی کردند و با بسیاری از سبکهای قالب جدید مبارزه کردند.
گروه چهارم، تیم انتشاراتی به رهبری آنکه بک در Mouton de Gruyter است که استانداردهای حرفهای آن همه ما را مجبور به تغییر مجدد کرد. -به بسیاری از جنبههای ارائه و قالببندی فکر کنید، و به توصیه چه کسی توانستیم در طراحی کلاس سند LaTeX برای تقلید از سبک خانه Mouton de Gruyter تکیه کنیم (اگرچه چند مورد عجیب و غریب خودمان باقی مانده است).
گروه پنجم. متشکل از مسئولین اداره کل سیزدهم کمیسیون اروپا، نوربرت برینخوف-باتون، افسر پروژه، و روبرتو سانسیونی، که شایسته قدردانی به خاطر آینده نگری و تمایل آنها برای متقاعد شدن به ریسک کردن با این سرمایه گذاری رمان انتشارات برای حوزه گفتاری است. فن آوری زبان، و بالاتر از همه برای صبر آنها در چیزی که باید مانند یک داستان تولید پایان ناپذیر به نظر می رسید.
هدف اصلی در طول فرآیند تولید فنی، تولید یک کتاب راهنمای با کیفیت بالا بود که از یک طرف هسته استاندارد را مستند می کرد. عمل خوب در طول دهه 1990، و از سوی دیگر یک پلت فرم محکم برای توسعه بیشتر ارائه می دهد. برای دستیابی به این هدف، تعدادی از فرآیندهای هموارسازی متن مورد نیاز بود. وظایف تبدیل فرمت و قالب بندی قبلا ذکر شده است. سبک و اصطلاح انگلیسی در چندین فصل، هم زبان بومی و هم غیر بومی، باید به میزان قابل توجهی برای خوانایی و سازگاری کلی تطبیق داده شود. بسیاری از همپوشانی ها حذف شد، بسیاری از جزئیات اضافی گنجانده شد، ارجاعات متقابل به فصل های دیگر و سایر گروه های کاری EAGLES گنجانده شد، حق چاپ (به عنوان مثال برای نسخه های الکترونیکی IPA) مورد مذاکره قرار گرفت، و مواد پیوست اضافی استخراج شد. برخی از ضمائم به طور ویژه برای کتاب راهنما نوشته شده بودند، اما بیشتر آنها با سخاوتمندانه توسط سایر پروژه های حمایت شده از کمیسیون اروپا، به ویژه پروژه SAM، ارائه شده بودند، و جدا از قالب بندی مجدد لازم، بدون تغییر باقی ماندند. به عنوان مثال، در زمینههای خاصی، با حق نسخهبرداری و ضبط مخفیانه، مسائل حقوقی و اخلاقی مطرح شد که فقط میتوان به صورت گذرا به آنها اشاره کرد.
توصیهها به صراحت در بخشهای فرعی هر فصل ارائه شدهاند، و بنابراین میتوان به راحتی به آنها اشاره کرد. با مراجعه به فهرست مطالب، که به طور عمدی نسبتاً مفصل نگهداری می شود و بنابراین به طور غیرعادی طولانی است. وظیفه «یکسان کردن» سبک توصیهها در مرحله کنونی بسیار جامع است، اما تا حدی به دلیل تنوع انواع توصیهها و تا حدودی به دلیل سبکهای ارائه متفاوت نویسندگان از رشتههای مختلف.
از زمان تصور اولیه گزارش چهار سال قبل از انتشار، اهمیت شبکه جهانی وب برای تحقیق بسیار گسترش یافته است. این باعث شده است که انتشار منابع برای مجموعه ها و ابزارها غیر ضروری باشد: موتورهای جستجوی وب می توانند به سرعت آدرس های به روز را پیدا کنند. دومین نکته که اندکی قبل از مرحله تولید نهایی مطرح شد، امکان انتشار در وب بود. مزایا و معایب این موضوع بسیار مورد بحث قرار گرفت و معیارهای قابل حمل کلی، دوام، استحکام و راحتی نسخههای کاغذی (با نسخههای کتابخانهای و جلد شومیز) در حالت فرامتن صرفاً الکترونیکی امتیازدهی شد. علاوه بر این، ناشر CD-ROM و شجاعانه نسخههای وب را ارائه میکند.
علیرغم تمام تلاشها، کتاب راهنما دارای تعدادی کاستیهای آشکار است و خوانندگان بدون شک انتخاب خود را از این موارد جمعآوری خواهند کرد. با توجه به کاستیها، از خوانندگان درخواست میکنم تا پیشنهادات خود را مطرح کنند و در نتیجه به بهبود نسخههای بعدی کتاب کمک کنند.
بخش اول: زبان گفتاری طراحی سیستم و پیکرهطراحی سیستم
طراحی پیکره SL
مجموعه پیکره SL
نمایش پیکره SL
بخش دوم: خصوصیات زبان گفتاری strong>
واژگان زبان گفتاری
مدل های زبان
مشخصات فیزیکی و توصیف
بخش سوم: ارزیابی سیستم زبان گفتاری
روش شناسی های ارزیابی و طراحی تجربی
ارزیابی سیستم های تشخیص
ارزیابی سیستم های تایید گوینده
ارزیابی سیستم های ترکیبی
ارزیابی سیستم های تعاملی
بخش چهارم: مواد مرجع زبان گفتاری >
کدهای نویسه و الفبای قابل خواندن رایانه
الفبای آوایی قابل خواندن رایانه SAMPA
قالب های فایل SAM
پروتکل های ضبط SAM
ابزارهای نرم افزار SAM
ابزار ضبط EUROPEC
رسانه های ذخیره سازی دیجیتال
سیستم های مدیریت پایگاه داده (DBMS)
استانداردهای گفتار
نمایش کلی پایگاه داده EUROM-1
نمای کلی پروژه Polyphone
منابع گفتاری اروپایی
رونویسی و کنوانسیون های مستند برای Speechdat
بایگانی باواریا برای سیگنال های گفتار
توضیحاتی در مورد کتاب به زبان اصلی :
Издательство Mouton de Gruyter, 1997, -1675 pp.
The technical production of this handbook has been a joint effort by several groups involving a large number of people, and the success of the coordination process in itself is by no means the least significant result of the EAGLES Spoken Language Working Group (see Chapter `User's Guide'), with particular credit to the fellow-members of the editorial team, Roger Moore and Richard Winski, for an inspiring and supportive style of collaboration.
The first group comprises the technical authors. All of them deserve thanks for their patience and cooperativeness, despite over-full schedules, heavy responsibilities and, in many cases, also the need to learn LaTeX in the process.
The second group includes the EAGLES support team, particularly the organisers in Pisa, Antonio Zampolli and Nicoletta Calzolari, with their untiring efforts to coordinate a somewhat unruly band of experts. Jock McNaught brought his editorial expertise in electronic publishing to bear on the initial layout design, and on solutions for a multitude of thorny problems.
The third group includes my team in Bielefeld, especially Inge Mertins, who put in a massive amount of work researching sources, re-formatting from a variety of source formats, taking care of complex style packages and spending month after month gently and effectively coaxing various authors to provide readable text, graphics and formulae. Thorsten Bomberg brought his expert knowledge of UNIX systems programming to bear on many technical problems; having found that available software did not scale up to handle a document of the size and complexity of this handbook, he specified and implemented a LaTeX to HTML conversion strategy which did work, and shared his results with the latex2html software developers, resulting in better software. Holger Ulrich Nord and Thorsten Trippel re-formatted the revised version in HTML, battling with many new format styles.
The fourth group is the publishing team led by Anke Beck at Mouton de Gruyter, whose professional standards forced us all to re-think many aspects of presentation and formatting, and on whose advice we were able to rely in designing a LaTeX document class to emulate the Mouton de Gruyter house style (though a couple of our own oddities remain).
The fifth group comprises those responsible at Directorate General XIII of the European Commission, Norbert Brinkhoff-Button, the project officer, and Roberto Cencioni, who deserve acknowledgment for their foresight, their willingness to be persuaded to take risks with this novel publishing venture for the field of spoken language technology, and above all for their patience in what must have seemed like an unending production story.
The main aim during the technical production process was to produce a high-quality handbook which on the one hand documents the core of standard good practice during the 1990s, and on the other hand presents a solid platform for further development. To attain this goal, a number of textual smoothing processes were required. The format conversion and formatting tasks have already been mentioned; English style and idiom in several chapters, by both native and non-native speakers, had to be considerably adapted for general readability and consistency. Many overlaps were removed, many additional details incorporated, cross-references to other chapters and the other EAGLES Working Groups were included, copyrights (for instance for electronic IPA versions) were negotiated, and additional appendix materials were elicited. Some of the appendices were specially written for the handbook, but most were generously provided by other European Commission funded projects, notably the SAM project, and were left unchanged apart from the necessary re-formatting. In certain areas, for instance, with corpus copyrights and with clandestine recording, legal and ethical issues arose, which could only be touched on in passing.
Recommendations are given explicitly in subsections in each chapter, and can thus be conveniently referred to by consulting the table of contents, which is deliberately kept rather detailed and is thus unusually long. The task of completely `homogenising' the style of recommendations proved to be too comprehensive at the present stage, however, partly because of the variety of recommendation types, and partly because of the different presentation styles of authors from different disciplines.
Since the original conception of the report four years before publication, the importance of the World Wide Web for research has expanded enormously. This has made the publication of sources for corpora and tools unnecessary: Web search engines can quickly find the up-to-date addresses. The second consideration which emerged shortly before the final production phase was the possibility of publication on the Web. The pros and cons of this were much debated, and criteria of overall portability, durability, robustness and convenience of paper versions (with library and paperback editions) scored over a purely electronic hypertext mode; in addition, the publisher is providing CD-ROM and, courageously, Web versions.
Despite all efforts, the handbook has a number of obvious shortcomings, and readers will no doubt collect their own selection of these. For the shortcomings I beg the readers' indulgence, and urge them to communicate their suggestions and thereby help to improve future versions of the handbook.
Part I: Spoken language system and corpus designSystem design
SL corpus design
SL corpus collection
SL corpus representation
Part II: Spoken language characterizationSpoken language lexica
Language models
Physical characterisation and description
Part III: Spoken language system assessmentAssessment methodologies and experimental design
Assessment of recognition systems
Assessment of speaker verification systems
Assessment of synthesis systems
Assessment of interactive systems
Part IV: Spoken language reference materialsCharacter codes and computer readable alphabets
SAMPA computer readable phonetic alphabet
SAM file formats
SAM recording protocols
SAM software tools
EUROPEC recording tool
Digital storage media
Database Management Systems (DBMSs)
Speech standards
EUROM-1 database overview
Polyphone project overview
European speech resources
Transcription and documentation conventions for Speechdat
The Bavarian Archive for Speech Signals