注重体验与质量的电子书资源下载网站
分类于: 其它 职场办公
简介
复杂数据统计方法: 基于R的应用(第三版) 豆 0.0分
资源最后更新于 2020-09-05 22:02:10
作者:吴喜之
出版社:中国人民大学出版社
出版日期:2015-01
ISBN:9787300215945
文件格式: pdf
标签: 数据分析 R 统计 吴喜之 机器学习 数据挖掘 统计学 数据统计与推论
简介· · · · · ·
本书自面世以来,得到了广大读者的支持和鼓励。目前的第三版在第二版的基础上做了相当大的增补,并且重新安排了章节,主要增加了贝叶斯网络、 定序变量的比例优势模型、调查问卷的垃圾比例计算等,总共增加将近1/3的篇幅.
本书没有按照数学模型的分类来编排,选择的数据也不像标准教科书中的例子那样“规范”,但这正是对真实数据和现实世界的反映。本书试图让读者理解世界是复杂的,数据形式是多种多样的,必须有超越书本、超越自我的智慧和勇气。
本书的读者对象包括数学、应用数学、统计、精算、经济、旅游、环境等专业的本科生以及数学、应用数学、统计、计量经济学、生物医学、应用统计、经济学等专业的硕士和博士生。
目录
前言
第一章引言
1.1作为科学的统计
1.2数据分析的实践
1.3数据的形式以及可能用到的模型
1.3.1横截面数据:因变量为实轴上的数量变量
1.3.2横截面数据:因变量为分类变量、频数或定序变量
1.3.3纵向数据、多水平数据、面板数据、重复观测数据
1.3.4多元数据各变量之间的关系:多元分析
1.3.5抽样调查数据中垃圾比例的计算
1.3.6路径模型/结构方程模型
1.3.7贝叶斯网络
1.3.8多元时间序列数据
1.4R软件入门
1.4.1简介
1.4.2安装和运行小贴士
1.4.3动手
1.5国内统计教学(课本)的若干误区
1.5.1假设检验的误区:不能拒绝就接受
1.5.2假设检验的误区:p值小于0.05就显著
1.5.3置信区间的误区
1.5.4最小二乘线性回归中的误区
1.5.5样本量是多少才算大样本
1.5.6用31个省、直辖市、自治区数据能做什么
1.5.7汇总数据(比如部分均值)和原始观测值的区别
第二章横截面数据回归:经典方法
2.1简单回归回顾
2.1.1对例2.1数据的简单拟合
2.1.2对例2.1数据的进一步分析
2.1.3对简单线性回归的一些讨论
2.1.4损失函数及分位数回归简介
2.2简单线性模型中的指数变换
2.3生存分析数据的Cox回归模型
2.4数据出现多重共线性情况:岭回归、lasso回归、适应性lasso回归、偏最小二乘回归
2.4.1岭回归
2.4.2lasso回归
2.4.3适应性lasso回归
2.4.4偏最小二乘回归
第三章横截面数据回归:机器学习方法
3.1没有任何先验假定的数据:机器学习回归方法
3.2决策树回归(回归树)
3.2.1拟合全部数据
3.2.2交叉验证
3.3boosting回归
3.4bagging回归
3.5随机森林回归
3.6支持向量机回归
3.6.1SVM
3.6.2SVR
3.6.3交叉验证
3.7人工神经网络回归
3.7.1确定合适的隐藏层节点数目
3.7.2交叉验证
3.810折交叉验证结果汇总及方法稳定性讨论
第四章横截面数据分类:经典方法
4.1logistic回归和probit回归
4.1.1广义线性模型简单回顾
4.1.2脊柱数据例子
4.1.3logistic回归
4.1.4probit回归
4.2经典判别分析
4.2.1关于例4.1column.2C.csv数据的两分类判别
4.2.2例4.1column.2C.csv数据两分类判别诸方法的10折交叉验证结果
4.2.3关于例4.1column.3C.csv数据的三分类判别
4.2.4关于例4.1column.3C.csv数据的三分类判别的三种方法的10折交叉验证结果
第五章横截面数据分类:机器学习方法
5.1对变量没有任何限制:机器学习分类方法
5.1.1概论和例子
5.1.2产生交叉验证数据集
5.2决策树分类(分类树)
5.2.1拟合全部数据
5.2.2交叉验证
5.3adaboost分类
5.3.1拟合全部数据
5.3.2交叉验证
5.4bagging分类
5.4.1拟合全部数据
5.4.2交叉验证
5.5随机森林分类
5.5.1拟合全部数据
5.5.2交叉验证
5.6支持向量机分类
5.6.1拟合全部数据
5.6.2交叉验证
5.7最近邻方法分类
5.8神经网络分类
5.8.1拟合
5.8.2神经网络对于不同参数的拟合效果分析
5.9分类方法10折交叉验证结果汇总
第六章横截面数据:计数或有序因变量
6.1概要和例子
6Poisson
6.2经典的Poisson对数线性模型回顾
6.3使用Poisson对数线性模型时的散布问题
6.4零膨胀时的Poisson回归
6.5用机器学习的算法模型拟合计数因变量数据
6.5.1随机森林拟合例6.1数据的10折交叉验证
6.5.2决策树(回归树)拟合例6.1数据的10折交叉验证
6.5.3支持向量机拟合例6.1数据的10折交叉验证
6.5.4各种方法拟合例6.1数据的10折交叉验证结果比较和一些讨论
6.6多项logit模型及多项分布对数线性模型回顾
6.6.1多项logit模型回顾
6.6.2多项分布对数线性模型回顾
6.7有序变量的比例优势模型
……
第七章纵向数据(多水平模型、面板数据)
第八章多元分析
第九章多元数据的关联规则分析
第十章调查数据中垃圾比例的计算
第十一章路径建模(结构方程建模)数据的PLS分析
第十二章贝叶斯网络
第十三章多元时间序列数据
附录练习:熟练使用R软件
参考文献
第一章引言
1.1作为科学的统计
1.2数据分析的实践
1.3数据的形式以及可能用到的模型
1.3.1横截面数据:因变量为实轴上的数量变量
1.3.2横截面数据:因变量为分类变量、频数或定序变量
1.3.3纵向数据、多水平数据、面板数据、重复观测数据
1.3.4多元数据各变量之间的关系:多元分析
1.3.5抽样调查数据中垃圾比例的计算
1.3.6路径模型/结构方程模型
1.3.7贝叶斯网络
1.3.8多元时间序列数据
1.4R软件入门
1.4.1简介
1.4.2安装和运行小贴士
1.4.3动手
1.5国内统计教学(课本)的若干误区
1.5.1假设检验的误区:不能拒绝就接受
1.5.2假设检验的误区:p值小于0.05就显著
1.5.3置信区间的误区
1.5.4最小二乘线性回归中的误区
1.5.5样本量是多少才算大样本
1.5.6用31个省、直辖市、自治区数据能做什么
1.5.7汇总数据(比如部分均值)和原始观测值的区别
第二章横截面数据回归:经典方法
2.1简单回归回顾
2.1.1对例2.1数据的简单拟合
2.1.2对例2.1数据的进一步分析
2.1.3对简单线性回归的一些讨论
2.1.4损失函数及分位数回归简介
2.2简单线性模型中的指数变换
2.3生存分析数据的Cox回归模型
2.4数据出现多重共线性情况:岭回归、lasso回归、适应性lasso回归、偏最小二乘回归
2.4.1岭回归
2.4.2lasso回归
2.4.3适应性lasso回归
2.4.4偏最小二乘回归
第三章横截面数据回归:机器学习方法
3.1没有任何先验假定的数据:机器学习回归方法
3.2决策树回归(回归树)
3.2.1拟合全部数据
3.2.2交叉验证
3.3boosting回归
3.4bagging回归
3.5随机森林回归
3.6支持向量机回归
3.6.1SVM
3.6.2SVR
3.6.3交叉验证
3.7人工神经网络回归
3.7.1确定合适的隐藏层节点数目
3.7.2交叉验证
3.810折交叉验证结果汇总及方法稳定性讨论
第四章横截面数据分类:经典方法
4.1logistic回归和probit回归
4.1.1广义线性模型简单回顾
4.1.2脊柱数据例子
4.1.3logistic回归
4.1.4probit回归
4.2经典判别分析
4.2.1关于例4.1column.2C.csv数据的两分类判别
4.2.2例4.1column.2C.csv数据两分类判别诸方法的10折交叉验证结果
4.2.3关于例4.1column.3C.csv数据的三分类判别
4.2.4关于例4.1column.3C.csv数据的三分类判别的三种方法的10折交叉验证结果
第五章横截面数据分类:机器学习方法
5.1对变量没有任何限制:机器学习分类方法
5.1.1概论和例子
5.1.2产生交叉验证数据集
5.2决策树分类(分类树)
5.2.1拟合全部数据
5.2.2交叉验证
5.3adaboost分类
5.3.1拟合全部数据
5.3.2交叉验证
5.4bagging分类
5.4.1拟合全部数据
5.4.2交叉验证
5.5随机森林分类
5.5.1拟合全部数据
5.5.2交叉验证
5.6支持向量机分类
5.6.1拟合全部数据
5.6.2交叉验证
5.7最近邻方法分类
5.8神经网络分类
5.8.1拟合
5.8.2神经网络对于不同参数的拟合效果分析
5.9分类方法10折交叉验证结果汇总
第六章横截面数据:计数或有序因变量
6.1概要和例子
6Poisson
6.2经典的Poisson对数线性模型回顾
6.3使用Poisson对数线性模型时的散布问题
6.4零膨胀时的Poisson回归
6.5用机器学习的算法模型拟合计数因变量数据
6.5.1随机森林拟合例6.1数据的10折交叉验证
6.5.2决策树(回归树)拟合例6.1数据的10折交叉验证
6.5.3支持向量机拟合例6.1数据的10折交叉验证
6.5.4各种方法拟合例6.1数据的10折交叉验证结果比较和一些讨论
6.6多项logit模型及多项分布对数线性模型回顾
6.6.1多项logit模型回顾
6.6.2多项分布对数线性模型回顾
6.7有序变量的比例优势模型
……
第七章纵向数据(多水平模型、面板数据)
第八章多元分析
第九章多元数据的关联规则分析
第十章调查数据中垃圾比例的计算
第十一章路径建模(结构方程建模)数据的PLS分析
第十二章贝叶斯网络
第十三章多元时间序列数据
附录练习:熟练使用R软件
参考文献