注重体验与质量的电子书资源下载网站
分类于: 计算机基础 云计算&大数据
简介
世界是随机的: 大数据时代的概率统计学 豆 0.0分
资源最后更新于 2020-03-29 05:02:49
作者:李帅
出版社:出版社清华大学出版社
出版日期:2017-03
文件格式: pdf
简介· · · · · ·
这是一本写给初学者的书,目的是帮助读者理解大数据下概率统计等概念的意义,写作中以案例作先导,引起读者的兴趣和思考,在解答问题的过程中讲述知识。本书共有9章,第1章和第2章介绍概率和*变量的基础知识,第3章和第4章介绍统计和分布的基础知识,第5章是专门介绍博彩的一章,前四章的知识在这里得到了应用,第6、7、8章分别介绍了概率统计的三个重要方法——假设检验、贝叶斯定理和线性回归,第9章是杂谈。本书努力避开说教式的言词,把知识融入故事中,在讲解知识的同时,带给读者阅读的乐趣。是一本难得的适合所有对概率统计感兴趣或者学习有需求的读者阅读。希望本书可以帮助读者更快速、更深刻的理解和应用大数据。李帅,大学本科和硕士均就读于清华大学电子工程系,现就职于国内某网络技术研究所,任网络工程师。硕士和工作期间曾参与云计算、大数据、网络流量分析等多个科研和工程项目,在云计算和数据分析等技术领域富有一定经验。
目录
内容简介
前言
第1章 概 率
1.1 生还是死:这是一个概率问题
鹰溪桥上的法克尔
薛定谔的猫
1.2 随机事件:翻飞的硬币
思想实验:抛硬币
实验1.0
实验2.0
度量随机事件
1.3 条件概率:门后的老山羊与豪车
“三门问题”
条件概率
1.4 独立事件:反复抛起的硬币
独立事件的含义
独立事件的数学表达
1.5 全概率法则:英超冠军争夺战
莱斯特城队的逆袭
莱斯特城队的夺冠概率
第2章 随机变量
2.1 随机变量:骰子游戏
掷骰子游戏
随机变量
离散与连续
2.2 期望与方差:百变骰子
期望
方差
协方差与相关系数
2.3 大数定理:庄家的信条
大数定理
空手套利的庄家
大数定理的误解
第3章 统 计
3.1 从样本到总体:管中窥豹
数据会说谎
抽样
3.2 频数、均值与中位数:致敬“黑曼巴”
频数
均值
中位数与箱线图
3.3 方差与标准差:致敬马刺
方差与标准差
3.4 均值与方差估计:近射与狙击
第4章 分 布
4.1 分布:统计学的“小九九”
4.2 等概率分布:硬币的两面
等概率的陷阱
4.3 几何分布:一次就好
4.4 二项分布:反复掷骰子
排列组合
二项分布
4.5 泊松分布:神奇的e
神奇的常数e
泊松分布
4.6 正态分布:完美曲线
正态分布
三大分布
4.7 指数分布:“二八”与“长尾”
强大的指数
指数分布
“二八定律”与“长尾理论”
第5章 赌博中的概率统计
5.1 赌博:激情与理性
5.2 双色球:千年等一回
投注规则
投注策略
5.3 足彩:爱足球,更爱足彩
投注规则
投注技巧
5.4 得州扑克:我不是教你诈
游戏规则
发牌前
底牌
公共牌
摊牌
5.5 21点:保守未必是坏事
游戏规则
三种策略
第6章 假设检验
6.1 主场优势:规律还是假象?
NBA的主场优势
世界杯的主场优势
6.2 假设检验:主场真的有优势吗?
定义主场优势
双边Z检验
单边Z检验
t检验
6.3 反证法:无罪推定
无罪推定
十二公民
第7章 贝叶斯定理
7.1 牧师贝叶斯:深藏功与名
牧师贝叶斯
贝叶斯定理
频率主义vs贝叶斯定理
7.2 赌神贝叶斯:一赌定终身
湖人队的夺冠概率
7.3 死神贝叶斯:连环恐怖袭击
连环袭击不是巧合
7.4 神探贝叶斯:嫌疑人X的献身
案情推演
7.5 朴素贝叶斯:智能分类
疾病诊断
垃圾邮件识别
第8章 线性回归
8.1 预测未来:以数据之名
谷歌流感趋势
预测世界杯
8.2 线性回归:奇准的票房预测
线性回归
8.3 拟合评估:拟合优度与分区段拟合
拟合优度
分区段拟合
过拟合
模型有效性
第9章 漫谈概率统计
9.1 正三观:概率统计常识
概率统计是“事后诸葛亮”
条件改变概率
均值不是唯一特征
出场顺序无碍竞赛公平
9.2 元认知:概率统计之“道”
检验确保正确
对比获得真知
提防线性思维
总是反过来想
模糊的正确胜过精确的错误
9.3 兵器谱:统计软件大盘点
通用软件
商用软件
开源软件
9.4 大数据:创新与挑战
新形态
新模式
新能力
新挑战
参考文献