توضیحاتی در مورد کتاب Python Text Processing with NLTK 2.0 Cookbook: Over 80 Practical Recipes for Using Python's NLTK Suite of Libraries to Maximize Your Natural Language Processing Capabilities
نام کتاب : Python Text Processing with NLTK 2.0 Cookbook: Over 80 Practical Recipes for Using Python's NLTK Suite of Libraries to Maximize Your Natural Language Processing Capabilities
ویرایش : 2. ed
عنوان ترجمه شده به فارسی : پردازش متن پایتون با NLTK 2.0 کتاب آشپزی: بیش از 80 دستور العمل عملی برای استفاده از مجموعه کتابخانه های NLTK پایتون برای به حداکثر رساندن قابلیت های پردازش زبان طبیعی شما
سری : Quick answers to common problems;Open source community experience destilled
نویسندگان : Fattohi. Faiz, Perkins. Jacob
ناشر : Packt Publishing Limited
سال نشر : 2010;2014
تعداد صفحات : 272
ISBN (شابک) : 9781849513609 , 1782167854
زبان کتاب : English
فرمت کتاب : pdf
حجم کتاب : 18 مگابایت
بعد از تکمیل فرایند پرداخت لینک دانلود کتاب ارائه خواهد شد. درصورت ثبت نام و ورود به حساب کاربری خود قادر خواهید بود لیست کتاب های خریداری شده را مشاهده فرمایید.
فهرست مطالب :
Cover......Page 1
Copyright......Page 3
Credits......Page 4
About the Author......Page 5
About the Reviewers......Page 6
Table of Contents......Page 8
Preface......Page 12
Introduction......Page 18
Tokenizing text into sentences......Page 19
Tokenizing sentences into words......Page 20
expressions......Page 22
Filtering stopwords in a tokenized sentence......Page 24
Looking up synsets for a word in WordNet......Page 25
in WordNet......Page 28
Calculating WordNet synset similarity......Page 30
Discovering word collocations......Page 32
Stemming words......Page 36
Lemmatizing words with WordNet......Page 39
Translating text with Babelfish......Page 41
Replacing words matching regular expressions......Page 43
Removing repeating characters......Page 45
Spelling correction with Enchant......Page 47
Replacing synonyms......Page 50
Replacing negations with antonyms......Page 52
Introduction......Page 56
Setting up a custom corpus......Page 57
Creating a word list corpus......Page 59
corpus......Page 61
Creating a chunked phrase corpus......Page 65
Creating a categorized text corpus......Page 69
Creating a categorized chunk corpus reader......Page 72
Lazy corpus loading......Page 79
Creating a custom corpus view......Page 81
Creating a MongoDB backed corpus reader......Page 85
Corpus editing with file locking......Page 88
Chapter 4: Part-of-Speech Tagging......Page 92
Default tagging......Page 93
Training a unigram part-of-speech tagger......Page 96
Combining taggers with backoff tagging......Page 99
Training and combining Ngram taggers......Page 100
Creating a model of likely word tags......Page 103
Tagging with regular expressions......Page 105
Affix tagging......Page 107
Training a Brill tagger......Page 109
Training the TnT tagger......Page 111
Using WordNet for tagging......Page 114
Tagging proper names......Page 116
Classifier based tagging......Page 117
Introduction......Page 122
Chunking and chinking with regular expressions......Page 123
Merging and splitting chunks with regular expressions......Page 128
regular expressions......Page 132
Partial parsing with regular expressions......Page 134
Training a tagger-based chunker......Page 137
Classification-based chunking......Page 140
Extracting named entities......Page 144
Extracting proper noun chunks......Page 146
Extracting location chunks......Page 148
Training a named entity chunker......Page 151
Introduction......Page 154
Filtering insignificant words......Page 155
Correcting verb forms......Page 157
Swapping verb phrases......Page 160
Swapping noun cardinals......Page 161
Swapping infinitive phrases......Page 162
Singularizing plural nouns......Page 164
Chaining chunk transformations......Page 165
Converting a chunk tree to text......Page 166
Flattening a deep tree......Page 168
Creating a shallow tree......Page 172
Converting tree nodes......Page 174
Introduction......Page 178
Bag of Words feature extraction......Page 179
Training a naive Bayes classifier......Page 181
Training a decision tree classifier......Page 188
Training a maximum entropy classifier......Page 191
classifier......Page 194
Calculating high information words......Page 198
Combining classifiers with voting......Page 202
Classifying with multiple binary classifiers......Page 204
Chapter 8: Distributed Processing and Handling Large Datasets......Page 212
Distributed tagging with execnet......Page 213
Distributed chunking with execnet......Page 217
Parallel list processing with execnet......Page 220
Storing a frequency distribution in Redis......Page 222
in Redis......Page 226
Storing an ordered dictionary in Redis......Page 229
and execnet......Page 232
Introduction......Page 238
Parsing dates and times with Dateutil......Page 239
Time zone lookup and conversion......Page 241
Tagging temporal expressions with Timex......Page 244
Extracting URLs from HTML with lxml......Page 245
Cleaning and stripping HTML......Page 247
BeautifulSoup......Page 249
encodings......Page 251
Appendix: Penn Treebank Part-of-Speech Tags......Page 254
Index......Page 258