توضیحاتی در مورد کتاب :
دادهکاوی مجموعههای عظیم داده، طرز تفکر ما را در مورد واکنش به بحران، بازاریابی، سرگرمی، امنیت سایبری و هوش ملی تغییر میدهد. مجموعهای از اسناد، تصاویر، ویدئوها و شبکهها نه تنها بهعنوان رشتههای بیتی برای ذخیره، نمایهسازی و بازیابی، بلکه بهعنوان منابع بالقوه کشف و دانش در نظر گرفته میشوند که به تکنیکهای تحلیل پیچیدهای نیاز دارند که بسیار فراتر از نمایهسازی کلاسیک و شمارش کلمات کلیدی است. با هدف یافتن تفسیرهای رابطه ای و معنایی از پدیده های زیربنایی داده ها.
Frontiers in Massive Data Analysis مرز تجزیه و تحلیل مقادیر انبوه داده را بررسی می کند، چه در یک پایگاه داده ایستا و چه در جریان یک سیستم. داده ها در آن مقیاس - ترابایت ها و پتابایت ها - به طور فزاینده ای در علم (به عنوان مثال، فیزیک ذرات، سنجش از دور، ژنومیک)، تجارت اینترنتی، تجزیه و تحلیل تجاری، امنیت ملی، ارتباطات و جاهای دیگر رایج است. ابزارهایی که برای استنتاج دانش از دادهها در مقیاسهای کوچکتر کار میکنند، لزوماً در چنین مقیاس وسیعی کار نمیکنند یا خوب کار نمیکنند. ابزارها، مهارتها و رویکردهای جدید ضروری هستند و این گزارش بسیاری از آنها را شناسایی میکند، بهعلاوه جهتهای پژوهشی امیدوارکننده برای کشف. Frontiers in Massive Data Analysis مشکلات در تلاش برای استنتاج دانش از داده های عظیم را مورد بحث قرار می دهد و هفت کلاس اصلی محاسبات را مشخص می کند که در تجزیه و تحلیل داده های انبوه رایج هستند. به طور کلی، این گزارش دانش بین رشتهای را نشان میدهد - از علوم کامپیوتر، آمار، یادگیری ماشین و رشتههای کاربردی - که باید برای استنتاج مفید از دادههای انبوه استفاده شود.
فهرست مطالب :
Cover......Page 1
Appendix B: Biographical Sketches of Committee Members......Page 0
©......Page 3
Acknowledgments......Page 10
Contents......Page 12
توضیحاتی در مورد کتاب به زبان اصلی :
Data mining of massive data sets is transforming the way we think about crisis response, marketing, entertainment, cybersecurity and national intelligence. Collections of documents, images, videos, and networks are being thought of not merely as bit strings to be stored, indexed, and retrieved, but as potential sources of discovery and knowledge, requiring sophisticated analysis techniques that go far beyond classical indexing and keyword counting, aiming to find relational and semantic interpretations of the phenomena underlying the data.
Frontiers in Massive Data Analysis examines the frontier of analyzing massive amounts of data, whether in a static database or streaming through a system. Data at that scale--terabytes and petabytes--is increasingly common in science (e.g., particle physics, remote sensing, genomics), Internet commerce, business analytics, national security, communications, and elsewhere. The tools that work to infer knowledge from data at smaller scales do not necessarily work, or work well, at such massive scale. New tools, skills, and approaches are necessary, and this report identifies many of them, plus promising research directions to explore. Frontiers in Massive Data Analysis discusses pitfalls in trying to infer knowledge from massive data, and it characterizes seven major classes of computation that are common in the analysis of massive data. Overall, this report illustrates the cross-disciplinary knowledge--from computer science, statistics, machine learning, and application disciplines--that must be brought to bear to make useful inferences from massive data