توضیحاتی در مورد کتاب :
این کتاب به معرفی مباحث Big Data، تجزیه و تحلیل داده ها و علم داده می پردازد و استفاده از داده های منبع باز را مشخص می کند. از جمله مباحث آماری شرح داده شده در این کتاب عبارتند از: تجسم داده ها، معیارهای توصیفی، احتمال، توزیع احتمال، مفهوم انتظارات ریاضی، فواصل اطمینان و آزمون فرضیه. همچنین تحلیل واریانس، رگرسیون خطی ساده، رگرسیون خطی چندگانه و تشخیص، توسعه مدلهای رگرسیون خطی چندگانه، جداول احتمالی، آزمونهای مجذور کای، روشهای ناپارامتریک و روش سریهای زمانی پوشش داده شدهاند. فصل ها شامل مثال های متعددی است که کاربرد جنبه های نظری ارائه شده را نشان می دهد. علاوه بر این، مسائل تمرین برای اطمینان از درک مفاهیم توسط خواننده و استفاده از آنها با استفاده از داده های واقعی طراحی شده اند. بیشتر دادهها از مناطق سراسر ایالات متحده میآیند، اگرچه برخی از مجموعه دادهها از اروپا و کشورهای سراسر جهان میآیند. علاوه بر این، دادههای پورتال باز مبنای بسیاری از مثالها و مشکلات خواهد بود و به مربی اجازه میدهد تا برنامه را با دادههای محلی که دانشآموزان میتوانند با آن شناسایی کنند، تطبیق دهد. یک پیوست شامل راه حل هایی برای برخی از این مشکلات عملی خواهد بود.
فهرست مطالب :
Statistics suck
so why do I need to learn about it? --
Concepts in statistics --
Data visualization --
Descriptive statistics --
Introduction to probability --
Discrete random variables --
Continuous random variables --
Properties of sample statistics --
Interval estimation for one population parameter --
Hypothesis testing for one population --
Statistical inference to compare parameters from two populations --
Analysis of variance (ANOVA) --
Simple linear regression --
Multiple linear regression --
Inference on association of categorical variables --
Nonparametric testing --
Forecasting.
توضیحاتی در مورد کتاب به زبان اصلی :
This book introduces the topics of Big Data, data analytics and data science and features the use of open source data. Among the statistical topics described in this book are: data visualization, descriptive measures, probability, probability distributions, the concept of mathematical expectation, confidence intervals, and hypothesis testing. Also covered are analysis of variance, simple linear regression, multiple linear regression and diagnostics, extensions to multiple linear regression models, contingency tables, Chi-square tests, non-parametric methods, and time series method. Chapters include multiple examples showing the application of the theoretical aspects presented. In addition, practice problems are designed to ensure that the reader understands the concepts and can apply them using real data. Most data will come from regions throughout the U.S. though some datasets come from Europe and countries around the world. Moreover, open portal data will be the basis for many of the examples and problems, allowing the instructor to adapt the application to local data with which students can identify. An appendix will include solutions to some of these practice problems.