注重体验与质量的电子书资源下载网站
分类于: 计算机基础 云计算&大数据
简介
R用户Python学习指南:数据科学方法: 数据科学与工程技术丛书 豆 0.0分
资源最后更新于 2020-03-29 02:39:53
作者:〔印〕A.奥利(A.Ohri)
译者:潘文捷李洪成
出版社:出版社机械工业出版社
出版日期:2018-10
ISBN:9787111611950
文件格式: pdf
标签: 编程语言 程序设计 Python 数据科学 数据科学与工程技术丛书
简介· · · · · ·
掌握一门语言、一种工具已不足以应对当今的数据分析任务,本书旨在解决这一问题,针对了解R但不熟悉Python(或了解Python但不熟悉R)的从业人员,详解讲解了两种语言的编程技巧和转换方法,提供大量实战案例,不讨论理论细节。A.奥利(A.Ohri),数据科学家,访问量超过100万次的知名博主。他曾为多家创业公司提供咨询服务,涉及的领域包括数据分析服务、数据分析教育和数据项目外包等。目前的研究兴趣涵盖开源分析、社交媒体分析、云计算交互等。他还著有《R for Business Analytics》和《R for Cloud Computing》。
目录
译者序
前言
第1章 Python、R和R数据科学简介
1.1 什么是Python
1.2 什么是R
1.3 什么是数据科学
1.4 数据科学家的未来
1.5 什么是大数据
1.6 商务分析与数据科学
1.7 数据科学家可用的工具
1.8 用于数据科学的Python添加包
1.9 Python和R之间的异同
1.10 教程
1.11 同时使用R和Python
1.12 其他软件和Python
1.13 将SAS与Jupyter一起使用
1.14 如何将Python和R用于大数据分析
1.15 什么是云计算
1.16 如何在云上使用Python和R
1.17 Python和R商业版本及其他替代版本
1.18 数据驱动的决策
参考文献
第2章 数据输入
2.1 pandas中的数据输入
2.2 网页抓取数据输入
2.3 来自RDBMS的数据输入
第3章 数据检查和数据质量
3.1 数据格式
3.2 数据质量
3.3 数据检查
3.4 数据选择
3.5 R中的数据检查
参考文献
第4章 探索性数据分析
4.1 根据分析分组
4.2 数值数据
4.3 分类数据
第5章 统计建模
5.1 回归的概念
5.2 相关关系不是因果关系
5.3 R和Python中的线性回归
5.4 R和Python中的Logistic回归
参考文献
第6章 数据可视化
6.1 数据可视化的概念
6.2 Tufte关于数据可视化的工作
6.3 Stephen Few关于仪表盘的设计
6.4 基本绘图
6.5 高级绘图
6.6 交互式绘图
6.7 空间分析
6.8 R中的数据可视化
参考文献
第7章 机器学习变得更容易
7.1 删除最终决策树模型中不需要的列
7.2 时间序列
7.3 关联分析
7.4 清洗语料库并制作词袋
第8章 结论和总结