توضیحاتی در مورد کتاب Learning Apache Drill: Query and Analyze Distributed Data Sources with SQL
نام کتاب : Learning Apache Drill: Query and Analyze Distributed Data Sources with SQL
ویرایش : 1
عنوان ترجمه شده به فارسی : آموزش تمرین آپاچی: منابع داده توزیع شده را با SQL جستجو و تجزیه و تحلیل کنید
سری :
نویسندگان : Charles Givre, Paul Rogers
ناشر : O’Reilly Media
سال نشر : 2018
تعداد صفحات : 331
ISBN (شابک) : 1492032794 , 9781492032793
زبان کتاب : English
فرمت کتاب : pdf
حجم کتاب : 8 مگابایت
بعد از تکمیل فرایند پرداخت لینک دانلود کتاب ارائه خواهد شد. درصورت ثبت نام و ورود به حساب کاربری خود قادر خواهید بود لیست کتاب های خریداری شده را مشاهده فرمایید.
توضیحاتی در مورد کتاب :
با Apache Drill، یک موتور جستجوی SQL توزیعشده توسعهیافته که مجموعههای داده عظیم را در بسیاری از فرمتهای فایل محبوب مانند Parquet، JSON و CSV میخواند، به سرعت برسید. Drill داده ها را در HDFS یا در فضای ذخیره سازی ابری مانند S3 می خواند و با متاستورهای Hive همراه با پایگاه های داده توزیع شده مانند HBase، MongoDB و پایگاه های داده رابطه ای کار می کند. Drill در همه جا کار می کند: روی لپ تاپ یا در بزرگترین خوشه شما.
در این کتاب عملی، چارلز گیور و پل راجرز متعهدهای Drill به تحلیلگران و دانشمندان داده نشان میدهند که چگونه دادههای خام را با استفاده از این ابزار قدرتمند پرس و جو و تجزیه و تحلیل کنند. امروزه دانشمندان داده حدود 80 درصد از زمان خود را صرف جمع آوری و تمیز کردن داده ها می کنند. با این کتاب، یاد خواهید گرفت که چگونه Drill به شما کمک می کند تا داده ها را به طور مؤثرتری تجزیه و تحلیل کنید تا زمان را به بینش کاهش دهید.
• از Drill برای تمیز کردن، آماده سازی و خلاصه کردن داده های محدود شده برای تجزیه و تحلیل بیشتر استفاده کنید
• انواع فایل پرس و جو از جمله logfiles، Parquet، JSON، و سایر فرمت های پیچیده
• پرس و جو Hadoop، پایگاه های داده رابطه ای، MongoDB، و Kafka با استاندارد SQL
• با استفاده از زبان های مختلف، به Drill متصل شوید
• از Drill حتی با فرمت های فایل چالش برانگیز یا مبهم استفاده کنید
• با گسترش عملکرد Drill با عملکردهای تعریف شده توسط کاربر، تجزیه و تحلیل پیچیده را انجام دهید
• تسهیل تجزیه و تحلیل داده ها برای امنیت شبکه، ابرداده تصویر، و یادگیری ماشین
توضیحاتی در مورد کتاب به زبان اصلی :
Get up to speed with Apache Drill, an extensible distributed SQL query engine that reads massive datasets in many popular file formats such as Parquet, JSON, and CSV. Drill reads data in HDFS or in cloud-native storage such as S3 and works with Hive metastores along with distributed databases such as HBase, MongoDB, and relational databases. Drill works everywhere: on your laptop or in your largest cluster.
In this practical book, Drill committers Charles Givre and Paul Rogers show analysts and data scientists how to query and analyze raw data using this powerful tool. Data scientists today spend about 80% of their time just gathering and cleaning data. With this book, you’ll learn how Drill helps you analyze data more effectively to drive down time to insight.
• Use Drill to clean, prepare, and summarize delimited data for further analysis
• Query file types including logfiles, Parquet, JSON, and other complex formats
• Query Hadoop, relational databases, MongoDB, and Kafka with standard SQL
• Connect to Drill programmatically using a variety of languages
• Use Drill even with challenging or ambiguous file formats
• Perform sophisticated analysis by extending Drill’s functionality with user-defined functions
• Facilitate data analysis for network security, image metadata, and machine learning