توضیحاتی در مورد کتاب :
خلاصه رام کردن متن، برنده جوایز Jolt 2013 برای بهره وری، راهنمای عملی و مبتنی بر مثال برای کار با متن بدون ساختار در زمینه برنامه های کاربردی دنیای واقعی است. این کتاب به بررسی نحوه سازماندهی خودکار متن با استفاده از رویکردهایی مانند جستجوی متن کامل، تشخیص نام مناسب، خوشهبندی، برچسبگذاری، استخراج اطلاعات و خلاصهسازی میپردازد. این کتاب شما را از طریق مثالهایی راهنمایی میکند که هر یک از این موضوعات را نشان میدهند، و همچنین پایههایی را که بر اساس آنها ساخته شدهاند. درباره این کتاب متن های زیادی در زندگی ما وجود دارد که ما عملاً در آن غرق می شویم. خوشبختانه، ابزارها و تکنیکهای نوآورانهای برای مدیریت اطلاعات بدون ساختار وجود دارد که میتواند برای توسعهدهندگان باهوش راه حیاتی بسیار مورد نیاز را ایجاد کند. آنها را در این کتاب خواهید یافت. Taming Text یک راهنمای کاربردی و مبتنی بر مثال برای کار با متن در برنامه های واقعی است. این کتاب شما را با تکنیکهای مفیدی مانند جستجوی متن کامل، تشخیص نام مناسب، خوشهبندی، برچسبگذاری، استخراج اطلاعات و خلاصهسازی آشنا میکند. شما موارد استفاده واقعی را در حین جذب سیستماتیک پایههایی که بر اساس آنها ساخته شدهاند، کشف خواهید کرد. سبک مختصر، این کتاب از اصطلاحات اصطلاحی اجتناب میکند و موضوع را با عباراتی توضیح میدهد که میتوانید بدون پیشزمینه آمار یا پردازش زبان طبیعی آن را بفهمید. مثال ها در جاوا هستند، اما مفاهیم را می توان در هر زبانی اعمال کرد. این کتاب که برای توسعه دهندگان جاوا نوشته شده است، نیازی به دانش قبلی درباره GWT ندارد. خرید کتاب چاپی با پیشنهاد یک کتاب الکترونیکی PDF، ePub و Kindle رایگان از Manning ارائه می شود. همچنین تمام کدهای کتاب موجود است. برنده جوایز Jolt 2013: The Best Books - یکی از پنج کتاب قابل توجهی که هر برنامه نویس جدی باید بخواند. چه چیزی در داخل است چه زمانی باید از تکنیکهای رام کردن متن استفاده کرد کتابخانههای منبع باز مهم مانند Solr و Mahout نحوه ساخت برنامههای پردازش متن درباره نویسندگان Grant Ingersoll یک مهندس، سخنران و مربی، یک Lucenecommitter و یکی از بنیانگذاران ماشین Mahout است. پروژه یادگیری توماس مورتون توسعه دهنده اولیه OpenNLP و Maximum Entropy است. Drew Farris یک مشاور فناوری، توسعهدهنده نرمافزار، و مشارکتکننده در Mahout، Lucene و Solr است. راز را از فرآیندهای بسیار پیچیده بیرون میکند.»—از پیشگفتار لیز لیدی، دین، iSchool، دانشگاه سیراکیوز فهرست مطالب شروع رام کردن متن مبانی رام کردن متن جستجوی تطبیق رشتههای فازی شناسایی افراد، مکانها و چیزها خوشهبندی متن طبقهبندی، طبقه بندی و برچسب گذاری ساختن نمونه سیستم پاسخگویی به سوال متن رام نشده: کاوش در مرز بعدی
توضیحاتی در مورد کتاب به زبان اصلی :
Summary Taming Text, winner of the 2013 Jolt Awards for Productivity, is a hands-on, example-driven guide to working with unstructured text in the context of real-world applications. This book explores how to automatically organize text using approaches such as full-text search, proper name recognition, clustering, tagging, information extraction, and summarization. The book guides you through examples illustrating each of these topics, as well as the foundations upon which they are built. About this Book There is so much text in our lives, we are practically drowningin it. Fortunately, there are innovative tools and techniquesfor managing unstructured information that can throw thesmart developer a much-needed lifeline. You'll find them in thisbook. Taming Text is a practical, example-driven guide to working withtext in real applications. This book introduces you to useful techniques like full-text search, proper name recognition,clustering, tagging, information extraction, and summarization.You'll explore real use cases as you systematically absorb thefoundations upon which they are built.Written in a clear and concise style, this book avoids jargon, explainingthe subject in terms you can understand without a backgroundin statistics or natural language processing. Examples arein Java, but the concepts can be applied in any language. Written for Java developers, the book requires no prior knowledge of GWT. Purchase of the print book comes with an offer of a free PDF, ePub, and Kindle eBook from Manning. Also available is all code from the book. Winner of 2013 Jolt Awards: The Best Books—one of five notable books every serious programmer should read. What's Inside When to use text-taming techniques Important open-source libraries like Solr and Mahout How to build text-processing applications About the Authors Grant Ingersoll is an engineer, speaker, and trainer, a Lucenecommitter, and a cofounder of the Mahout machine-learning project. Thomas Morton is the primary developer of OpenNLP and Maximum Entropy. Drew Farris is a technology consultant, software developer, and contributor to Mahout,Lucene, and Solr. "Takes the mystery out of verycomplex processes."—From the Foreword by Liz Liddy, Dean, iSchool, Syracuse University Table of Contents Getting started taming text Foundations of taming text Searching Fuzzy string matching Identifying people, places, and things Clustering text Classification, categorization, and tagging Building an example question answering system Untamed text: exploring the next frontier