توضیحاتی در مورد کتاب Beginning Apache Spark 2: With Resilient Distributed Datasets, Spark SQL, Structured Streaming and Spark Machine Learning library
نام کتاب : Beginning Apache Spark 2: With Resilient Distributed Datasets, Spark SQL, Structured Streaming and Spark Machine Learning library
عنوان ترجمه شده به فارسی : شروع آپاچی اسپارک 2: با مجموعه داده های توزیع شده انعطاف پذیر، Spark SQL، جریان ساخت یافته و کتابخانه یادگیری ماشینی Spark
سری :
نویسندگان : Hien Luu
ناشر : Apress
سال نشر : 2018
تعداد صفحات : 398
ISBN (شابک) : 1484235789 , 9781484235782
زبان کتاب : English
فرمت کتاب : pdf
حجم کتاب : 6 مگابایت
بعد از تکمیل فرایند پرداخت لینک دانلود کتاب ارائه خواهد شد. درصورت ثبت نام و ورود به حساب کاربری خود قادر خواهید بود لیست کتاب های خریداری شده را مشاهده فرمایید.
توضیحاتی در مورد کتاب :
برنامه های کاربردی برای چشم انداز کلان داده با Spark و Hadoop توسعه دهید. این کتاب همچنین نقش Spark را در توسعه برنامههای یادگیری ماشینی مقیاسپذیر و تجزیه و تحلیل با فناوریهای Cloud توضیح میدهد. Beginning Apache Spark 2 به شما معرفی Apache Spark را می دهد و نحوه کار با آن را به شما نشان می دهد.
در طول مسیر، مجموعه داده های توزیع شده انعطاف پذیر (RDD) را کشف خواهید کرد. از Spark SQL برای داده های ساخت یافته استفاده کنید. و پردازش استریم را بیاموزید و برنامه های بلادرنگ را با Spark Structured Streaming بسازید. علاوه بر این، اصول Spark ML را برای یادگیری ماشینی و موارد دیگر خواهید آموخت.
پس از خواندن این کتاب، اصول لازم برای مهارت در استفاده از Apache Spark را خواهید داشت و می دانید که چه زمانی و چگونه آن را در برنامه های داده بزرگ خود اعمال کنید.
آنچه شما یاد خواهید گرفت
• پلت فرم پردازش داده یکپارچه Spark را درک کنید
• نحوه اجرای Spark در Spark Shell یا Databricks
• از RDD ها استفاده و دستکاری کنید
• با داده های ساخت یافته با استفاده از Spark SQL از طریق عملیات و توابع پیشرفته آن مقابله کنید
• با استفاده از Spark Structured Streaming برنامه های بلادرنگ بسازید
• برنامه های هوشمند را با کتابخانه Spark Machine Learning توسعه دهید
این کتاب برای چه کسی است
برنامه نویسان و توسعه دهندگان فعال در داده های بزرگ، Hadoop و جاوا اما تازه وارد پلتفرم Apache Spark هستند.
فهرست مطالب :
Front Matter ....Pages i-xi
Introduction to Apache Spark (Hien Luu)....Pages 1-13
Working with Apache Spark (Hien Luu)....Pages 15-49
Resilient Distributed Datasets (Hien Luu)....Pages 51-86
Spark SQL (Foundations) (Hien Luu)....Pages 87-145
Spark SQL (Advanced) (Hien Luu)....Pages 147-217
Spark Streaming (Hien Luu)....Pages 219-286
Spark Streaming (Advanced) (Hien Luu)....Pages 287-326
Machine Learning with Spark (Hien Luu)....Pages 327-383
Back Matter ....Pages 385-393
توضیحاتی در مورد کتاب به زبان اصلی :
Develop applications for the big data landscape with Spark and Hadoop. This book also explains the role of Spark in developing scalable machine learning and analytics applications with Cloud technologies. Beginning Apache Spark 2 gives you an introduction to Apache Spark and shows you how to work with it.
Along the way, you’ll discover resilient distributed datasets (RDDs); use Spark SQL for structured data; and learn stream processing and build real-time applications with Spark Structured Streaming. Furthermore, you’ll learn the fundamentals of Spark ML for machine learning and much more.
After you read this book, you will have the fundamentals to become proficient in using Apache Spark and know when and how to apply it to your big data applications.
What You Will Learn
• Understand Spark unified data processing platform
• How to run Spark in Spark Shell or Databricks
• Use and manipulate RDDs
• Deal with structured data using Spark SQL through its operations and advanced functions
• Build real-time applications using Spark Structured Streaming
• Develop intelligent applications with the Spark Machine Learning library
Who This Book Is For
Programmers and developers active in big data, Hadoop, and Java but who are new to the Apache Spark platform.