注重体验与质量的电子书资源下载网站
分类于: 计算机基础 云计算&大数据
简介
R语言: 大数据应用人才培养系列教材 豆 0.0分
资源最后更新于 2020-03-29 01:24:43
作者:程显毅 等
出版社:出版社清华大学出版社
出版日期:2019-01
ISBN:9787302494324
文件格式: pdf
标签: 计算机 教材 程序设计 大数据 大数据应用人才培养系列教材
简介· · · · · ·
近年来,R语言可谓是数据分析的热门语言,相关的资料五花八门,让读者难以抉择。本书简洁、精练,以理论与实践相结合的方式让大家快速掌握R语言。全书共14章,第1章为绪论,从数学、统计学和逻辑学3个方面探讨了树立正确数据思维的一些原则。其余各章分为基础篇(第2~10章)、应用篇(第11、12章)和进阶篇(第13、14章)。基础篇按照数据分析过程,主要讨论了R的数据结构、数据导入/导出、数据清洗、数据变换、可视化、高级语言编程和常用建模方法。应用篇通过对2个经典案例的分析,使读者能够把学到的R基础知识应用到解决实际问题中,把数据变成价值。进阶篇解决如何用R处理大数据的一些关键技术。本书可用作培养应用型人才的课程教材,也可作为数据分析爱好者的参考资料。程显毅,1956年12月生,哈尔滨人,教授,博士,现任中国人工智能学会知识工程专委会委员、江苏省微电脑学会人工智能专委会副主任委员、江苏省人工智能学会监事、江苏省大数据专家委员会委员、江苏省云计算论坛专家委员会委员。
目录
内容简介
总主编简介
本书主编简介
总 序
前 言
第1章 绪 论
1.1 为什么学习R语言
1.2 正确的数据思维观
习题
基础篇
第2章 R语言入门
2.1 新手上路
2.2 R语言开发环境部署
2.3 获取帮助
2.4 工作空间
2.5 脚本
2.6 R包
习题
第3章 数据类型
3.1 变量与常量
3.2 结构类型
3.3 字符串操作
3.4 用于数据处理和转换的常用函数
习题
第4章 数据准备
4.1 数据导入
4.2 数据导出
习题
第5章 数据可视化
5.1 低水平绘图命令
5.2 高水平绘图命令
5.3 交互式绘图命令
习题
第6章 数据探索
6.1 缺失值分析
6.2 异常值分析
6.3 不一致值分析
6.4 数据的统计特征分析
习题
第7章 数据变换
7.1 数据清洗
7.2 数据选择
7.3 数据集成
习题
第8章 高级编程
8.1 控制结构
8.2 用户自定义函数
习题
第9章 数据建模
9.1 Rattle包
9.2 聚类模型
9.3 关联分析模型
9.3.4 Apriori算法
9.4 传统决策树模型
9.5 随机森林决策树模型
9.6 自适应选择决策树模型
9.7 SVM
9.8 线性回归模型
9.9 神经网络模型
习题
第10章 模型评估
10.1 数据集
10.2 混淆矩阵
10.3 风险图
10.4 ROC曲线
习题
应用篇
第11章 影响大学平均录取分数线因素分析
11.1 背景与目标
11.2 数据说明
11.3 描述性分析
11.4 总结与建议
第12章 收视率分析
12.1 背景介绍
12.2 数据说明
12.3 描述性分析
12.4 总结与建议
进阶篇
第13章 RHadoop
13.1 认识RHadoop
13.2 RHadoop安装
13.3 综合练习
习题
第14章 SparkR
14.1 认识SparkR
14.2 SparkDataFrame
14.3 SparkR支持的机器学习算法
14.4 综合练习
习题
参考文献
附录 大数据和人工智能实验环境
附录CD