Spark: The Definitive Guide: Big Data Processing Made Simple

دانلود کتاب Spark: The Definitive Guide: Big Data Processing Made Simple

53000 تومان موجود

کتاب Spark: The Definitive Guide: Big Data Processing Simple نسخه زبان اصلی

دانلود کتاب Spark: The Definitive Guide: Big Data Processing Simple بعد از پرداخت مقدور خواهد بود
توضیحات کتاب در بخش جزئیات آمده است و می توانید موارد را مشاهده فرمایید


این کتاب نسخه اصلی می باشد و به زبان فارسی نیست.


امتیاز شما به این کتاب (حداقل 1 و حداکثر 5):

امتیاز کاربران به این کتاب:        تعداد رای دهنده ها: 11


توضیحاتی در مورد کتاب Spark: The Definitive Guide: Big Data Processing Made Simple

نام کتاب : Spark: The Definitive Guide: Big Data Processing Made Simple
ویرایش : 1
عنوان ترجمه شده به فارسی : Spark: The Definitive Guide: Big Data Processing Simple
سری :
نویسندگان : ,
ناشر : O’Reilly Media
سال نشر : 2018
تعداد صفحات : 601
ISBN (شابک) : 1491912219 , 9781491912218
زبان کتاب : English
فرمت کتاب : pdf
حجم کتاب : 8 مگابایت



بعد از تکمیل فرایند پرداخت لینک دانلود کتاب ارائه خواهد شد. درصورت ثبت نام و ورود به حساب کاربری خود قادر خواهید بود لیست کتاب های خریداری شده را مشاهده فرمایید.

توضیحاتی در مورد کتاب :




با این راهنمای جامع که توسط سازندگان چارچوب محاسبات خوشه‌ای منبع باز نوشته شده است، نحوه استفاده، استقرار و نگهداری Apache Spark را بیاموزید. نویسندگان بیل چمبرز و متی زهاریا با تأکید بر بهبودها و ویژگی‌های جدید در Spark 2.0، موضوعات Spark را به بخش‌های مجزا تقسیم می‌کنند که هر کدام اهداف منحصربه‌فردی دارند.

شما عملیات‌های اساسی و عملکردهای مشترک Spark را بررسی خواهید کرد. APIهای ساختاریافته، و همچنین جریان ساخت یافته، یک API سطح بالا جدید برای ساخت برنامه‌های استریم سرتاسر. توسعه‌دهندگان و مدیران سیستم اصول نظارت، تنظیم و اشکال‌زدایی Spark را یاد می‌گیرند و تکنیک‌ها و سناریوهای یادگیری ماشین را برای استفاده از MLlib، کتابخانه یادگیری ماشینی مقیاس‌پذیر Spark، بررسی می‌کنند.

  • دریافت نمای کلی ملایمی از داده های بزرگ و Spark
  • درباره DataFrames، SQL و Datasets بیاموزید—APIهای اصلی Spark—از طریق مثال های کارآمد
  • در API های سطح پایین Spark، RDD ها و اجرای SQL و DataFrames بیاموزید.
  • درک نحوه عملکرد Spark روی یک خوشه
  • اشکال‌زدایی، نظارت و تنظیم خوشه‌ها و برنامه‌های Spark
  • با قدرت جریان ساختاریافته، موتور پردازش جریان Spark آشنا شوید.
  • بیاموزید که چگونه می توانید MLlib را برای انواع مشکلات، از جمله طبقه بندی یا توصیه، اعمال کنید

فهرست مطالب :


Part 1. Gentle overview of big data and Spark. What is Apache Spark? --
A gentle introduction to Spark --
A tour of Spark\'s toolset --
Part 2. Structured APIs : DataFrames, SQL, and datasets. Structured API overview --
Basic structured operations --
Working with different types of data --
Aggregations --
Joins --
Data sources --
Spark SQL --
Datasets --
Part 3. Low-level APIs. Resilient distributed datasets (RDDs) --
Advanced RDDs --
Distributed shared variables --
Part 4. Production applications. How Spark runs on a cluster --
Developint Spark applications --
Deploying Spark --
Monitoring and debugging --
Performance tuning --
Part 5. Streaming. Stream processing fundamentals --
Structured streaming basics --
Event-time and stateful processing --
Structured streaming in production --
Part 6. Advanced analytics and machine learning. Advanced analytics and machine learning overview --
Preprocessing and feature engineering --
Classification --
Regression --
Recommendation --
Unsupervised learning --
Graph analytics --
Deep learning --
Part 7. Ecosystem. Language specifics : Python (PySpark) and R (SparkR and sparklyr) --
Ecosystem and community.

توضیحاتی در مورد کتاب به زبان اصلی :


Learn how to use, deploy, and maintain Apache Spark with this comprehensive guide, written by the creators of the open-source cluster-computing framework. With an emphasis on improvements and new features in Spark 2.0, authors Bill Chambers and Matei Zaharia break down Spark topics into distinct sections, each with unique goals.

You’ll explore the basic operations and common functions of Spark’s structured APIs, as well as Structured Streaming, a new high-level API for building end-to-end streaming applications. Developers and system administrators will learn the fundamentals of monitoring, tuning, and debugging Spark, and explore machine learning techniques and scenarios for employing MLlib, Spark’s scalable machine-learning library.

  • Get a gentle overview of big data and Spark
  • Learn about DataFrames, SQL, and Datasets—Spark’s core APIs—through worked examples
  • Dive into Spark’s low-level APIs, RDDs, and execution of SQL and DataFrames
  • Understand how Spark runs on a cluster
  • Debug, monitor, and tune Spark clusters and applications
  • Learn the power of Structured Streaming, Spark’s stream-processing engine
  • Learn how you can apply MLlib to a variety of problems, including classification or recommendation



پست ها تصادفی