توضیحاتی در مورد کتاب Big Data Processing Using Spark in Cloud
نام کتاب : Big Data Processing Using Spark in Cloud
عنوان ترجمه شده به فارسی : پردازش کلان داده با استفاده از Spark در Cloud
سری : Studies in Big Data
نویسندگان : Mamta Mittal , Valentina E. Balas , Lalit Mohan Goyal , Raghvendra Kumar
ناشر : Springer
سال نشر : 2019
تعداد صفحات : 274
ISBN (شابک) : 9789811305504
زبان کتاب : English
فرمت کتاب : pdf
حجم کتاب : 8 مگابایت
بعد از تکمیل فرایند پرداخت لینک دانلود کتاب ارائه خواهد شد. درصورت ثبت نام و ورود به حساب کاربری خود قادر خواهید بود لیست کتاب های خریداری شده را مشاهده فرمایید.
توضیحاتی در مورد کتاب :
این کتاب ظهور فناوریهای کلان داده و نقش Spark در کل پشته کلان داده را توصیف میکند. Spark و Hadoop را با هم مقایسه می کند و کاستی های Hadoop را که توسط Spark برطرف شده است شناسایی می کند. این کتاب عمدتاً بر روی معماری عمیق Spark و درک ما از Spark RDD ها و اینکه چگونه RDD ماهیت تغییرناپذیر داده های بزرگ را تکمیل می کند، تمرکز دارد و آن را با ارزیابی تنبل، قابل ذخیره سازی و استنتاج نوع حل می کند. همچنین به موضوعات پیشرفته در Spark می پردازد که از اصول اولیه Scala و چارچوب اصلی Spark شروع می شود و فریم های داده Spark، یادگیری ماشین با استفاده از Mllib، تجزیه و تحلیل گراف با استفاده از Graph X و پردازش بلادرنگ با Apache Kafka، AWS Kenisis و Azure را بررسی می کند. مرکز رویداد. سپس به بررسی Spark با استفاده از PySpark و R میپردازد. با تمرکز بر پشته کلان داده فعلی، این کتاب به بررسی تعامل با ابزارهای کلان داده فعلی میپردازد، با Spark که لایه پردازش اصلی برای همه انواع دادهها است.
این کتاب برای مهندسین داده و دانشمندانی است که روی مجموعه دادههای عظیم و فناوریهای کلان داده در فضای ابری کار میکنند. علاوه بر متخصصان صنعت، برای متخصصان مشتاق پردازش داده و دانش آموزانی که در محیط های پردازش داده های بزرگ و محاسبات ابری کار می کنند مفید است.
توضیحاتی در مورد کتاب به زبان اصلی :
The book describes the emergence of big data technologies and the role of Spark in the entire big data stack. It compares Spark and Hadoop and identifies the shortcomings of Hadoop that have been overcome by Spark. The book mainly focuses on the in-depth architecture of Spark and our understanding of Spark RDDs and how RDD complements big data’s immutable nature, and solves it with lazy evaluation, cacheable and type inference. It also addresses advanced topics in Spark, starting with the basics of Scala and the core Spark framework, and exploring Spark data frames, machine learning using Mllib, graph analytics using Graph X and real-time processing with Apache Kafka, AWS Kenisis, and Azure Event Hub. It then goes on to investigate Spark using PySpark and R. Focusing on the current big data stack, the book examines the interaction with current big data tools, with Spark being the core processing layer for all types of data.
The book is intended for data engineers and scientists working on massive datasets and big data technologies in the cloud. In addition to industry professionals, it is helpful for aspiring data processing professionals and students working in big data processing and cloud computing environments.