توضیحاتی در مورد کتاب :
Bloomsbury, 2015. — 321 pp.
ایده این کتاب درسی زمانی مطرح شد که ساندرا در حال تدریس زبانشناسی پیکره ای به دانشجویان زبانشناسی و زبانشناسی محاسباتی در دانشگاه ایندیانا بود. یکی از اهداف این دوره این بود که به دانشآموزان خود نشان دهد که مجموعههای حاشیهنویسی و ابزارهای ایجاد شده در زبانشناسی محاسباتی چقدر مفید هستند. او به زودی متوجه شد که دو گروه از دانش آموزان با توجه به دانش قبلی تفاوت قابل توجهی دارند. بسیاری از مفاهیمی که برای دانشجویان زبان شناسی محاسباتی او آشنا بود برای زبان شناسان جدید بود. او همچنین لازم دید که دانشآموزان را با ابزارهایی آشنا کند که امکان دسترسی آسان به مجموعهها را فراهم میکنند، بهویژه آنهایی که فراتر از متن خالص هستند. مجموعههای حاشیهنویسی دو نوع چالش را ارائه میکنند: از یک سو، حاشیهنویسیهایی ارائه میکنند که اغلب برای زبانشناسان آشنا نیستند. حاشیه نویسی باید متون کامل را پوشش دهد و بنابراین بسیاری از پدیده ها را که در ادبیات زبانی به خوبی مورد بحث قرار نمی گیرند. به همین دلیل، آنها تمایل به تمایز کمتری نسبت به تحلیل های زبانی دارند. از سوی دیگر، جستجو در حاشیه نویسی به ابزارهای جستجوی تخصصی نیاز دارد که به تنهایی به سختی قابل تشخیص است. علاوه بر این، مستندات حاشیه نویسی و ابزارها اغلب دانشی را فرض می کند که به راحتی در دسترس کاربر ناآشنا نیست. هدف این کتاب پر کردن شکاف دانش بین کاربران زبانشناسی و مستندات موجود منابع و همچنین ترویج استفاده از مجموعههای حاشیهشناختی زبانی به جامعه زبانی به طور کلی است.
این کتاب یک کتاب واقعی بوده است. همکاری بین این دو نویسنده با ساندرا که تخصص خود را در حاشیه نویسی در سطح کلمه و نحوی به پروژه آورده است و هایکه تخصص خود را در حاشیه نویسی معنایی و گفتگو. اما شکل نهایی از طریق گفتگو مشخص شد. در پایان هر دوی ما چیزهای زیادی در مورد موضوعات مطرح شده در کتاب یاد گرفتیم و همچنین فهمیدیم که کتاب بیشتر از مجموع اجزای آن است.
< strong>مقدمه
Corpus Linguistics
Corpora and Linguistic Annotation
Linguistic Annotation Linguistic Annotation
Linguistic Annotation on the word
حاشیه نویسی نحوی
حاشیه نویسی معنایی
حاشیه نویسی گفتمان
استفاده از حاشیه نویسی زبانی در زبان شناسی مجموعه مزایا و محدودیت های استفاده از بخش های حاشیه نویسی زبانی
استفاده از حاشیه نویسی زبانشناسی از نظر زبانشناسی Corpora
جستجوی زبانی حاشیه نویسی شده تطابقات
عبارات منظم
جستجو در سطح کلمه
پرسش ساختارهای نحوی
جستجوی معنایی و پدیده گفتمان
Penn Treebank POS Tagset
ICE POS Tagsset
توضیحاتی در مورد کتاب به زبان اصلی :
Bloomsbury, 2015. — 321 pp.
The idea for this textbook emerged when Sandra was teaching corpus linguistics to linguistics and computational linguistics students at Indiana University. One of the goals of this course was to demonstrate to her students how useful annotated corpora and tools established in computational linguistics are. She soon realized the two groups of students differed considerably with regard to prior knowledge. Many concepts that were familiar to her computational linguistics students were new to the linguists. She also found it necessary to introduce students to tools that allow easy access to corpora, especially those that go beyond pure text. Annotated corpora offer two types of challenges: On the one hand, they provide annotations that are often not familiar to linguists. Annotations need to cover complete texts, and thus many phenomena that are not well discussed in linguistic literature. For this reason, they tend to make fewer distinctions than linguistic analyses. On the other hand, the search in annotations requires specialized search tools, which are difficult to figure out on one’s own. Additionally, the documentation of annotations and of tools often assumes knowledge that is not readily available to an uninitiated user. The goal of this book is to bridge the knowledge gap between linguistic users and the available documentation of the resources, as well as to promote the use of linguistically annotated corpora to the linguistic community in general.
This book has been a true collaboration between the two authors, with Sandra bringing her expertise in word-level and syntactic annotation to the project and Heike her expertise in semantic and dialogue annotation. But the final form was determined through dialogue. In the end, we both learned a lot about the topics covered in the book, and we also learned that the book is more than the sum of its parts.
IntroductionCorpus Linguistics
Corpora and Linguistic Annotation
Linguistic Annotation Linguistic Annotation on the Word Level
Syntactic Annotation
Semantic Annotation
Discourse Annotation
Using Linguistic Annotation in Corpus Linguistics Advantages and Limitations of Using Linguistically Annotated Corpora
Corpus Linguistics Using Linguistically Annotated Corpora
Querying Linguistically Annotated Corpora Concordances
Regular Expressions
Searching on the Word Level
Querying Syntactic Structures
Searching for Semantic and Discourse Phenomena
Penn Treebank POS Tagset
ICE POS Tagset