注重体验与质量的电子书资源下载网站
分类于: 设计 互联网
简介
R 语言数据分析项目精解:理论、方法、实战 豆 0.0分
资源最后更新于 2020-10-05 18:44:27
作者:罗荣锦
出版社:电子工业出版社
出版日期:2017-01
ISBN:9787121315732
文件格式: pdf
标签: 数据分析 R 互联网 干货 代码详细 产品 网站 当当
简介· · · · · ·
《R 语言数据分析项目精解:理论、方法、实战》以互联网电商企业为背景,抽象出工作中常见的数据分析问题,利用R 语言和统计学列出了详细的解决方案和过程。《R 语言数据分析项目精解:理论、方法、实战》共9 章,前两章分别为总论和R 语言入门知识,之后各章分别介绍了运营指标的建立、指标监控系统、假设检验及AB 测试、变量筛选技术、用户画像系统、寻找优质用户和文本挖掘等内容。本书涉及到的统计方法有:指标增长幅度量化方法、层次分析法、时间序列模型、基于正态分布的一元离群点检验、傅里叶谱分析、假设检验、主成分分析、因子分析、模糊聚类、无监督下连续型变量离散化、逻辑回归模型和文本挖掘等。另外,《R 语言数据分析项目精解:理论、方法、实战》提供了所有实例的R 语言实现代码,总计33 个自定义函数和数千行代码。
《R 语言数据分析项目精解:理论、方法、实战》适合数据分...
目录
第1 章 互联网+统计学+R 语言1
1.1 互联网中的统计学 1
1.1.1 “互联网+”的发展 1
1.1.2 统计学的发展 2
1.1.3 大数据时代的统计学 2
1.2 R 语言——互联网与统计学的桥梁 3
1.3 本书结构5
第2 章 R 语言基础7
2.1 安装R 语言 7
2.1.1 获取和安装R 语言 7
2.1.2 安装RStudio 9
2.1.3 R 包 10
2.1.4 帮助 12
2.2 R 语言基本对象 12
2.2.1 数据类型12
2.2.2 向量 12
2.2.3 矩阵和数组19
2.2.4 列表 27
2.2.5 数据框 29
2.2.6 因子 32
2.2.7 数据类型的辨别和转换 39
2.2.8 数据类型和对象关系 39
2.3 工作空间和查看对象 40
2.3.1 工作空间和工作目录 40
2.3.2 遍历、创建、删除文件夹41
2.3.3 查看对象的方法 42
2.4 数据导入和导出 43
2.4.1 数据导入43
2.4.2 数据导出49
2.5 操作符和函数 51
2.5.1 操作符 51
2.5.2 函数 54
2.6 数据集操作59
2.6.1 变量操作60
2.6.2 数据集操作63
2.6.3 数据集连接67
2.6.4 数据汇总68
2.7 控制流71
2.7.1 重复和循环71
2.7.2 条件执行73
2.7.3 next 和break 74
2.8 自定义函数75
第3 章 互联网运营指标的建立 77
3.1 项目背景、目标及方案78
3.1.1 项目背景78
3.1.2 项目目标78
3.1.3 项目方案78
3.2 项目技术理论简介78
3.2.1 骨灰级流量指标 78
3.2.2 登录和激活80
2.2.3 访问深度和吸引力81
3.2.4 订单指标85
3.2.5 网站或APP 性能指标 86
3.2.6 转化率 87
3.2.7 层次分析法87
3.3 项目实践 92
3.3.1 搭建运营指标系统92
3.3.2 制作对比型指标及趋势线97
3.3.3 创建用户价值和活跃度指标101
第4 章 指标监控系统111
4.1 项目背景、目标及方案111
4.1.1 项目背景.111
4.1.2 项目目标.111
4.1.3 项目方案 112
4.2 项目技术理论简介 112
4.2.1 时间序列基本统计量112
4.2.2 数据观测与描述性统计 113
4.2.3 随机性 115
4.2.4 周期性 115
4.2.5 节假日模式识别 115
4.2.6 建模数据集的建立 118
4.2.7 指标监控方法(不含节假日) 125
4.2.8 节假日指标监控方法134
4.2.9 R 语言实例代码 135
4.3 项目实践 141
4.3.1 数据概览 142
4.3.2 节假日模式识别 145
4.3.3 模型数据集的建立 155
4.3.4 指标监控(非节假日) 160
4.3.5 节假日指标监控 176
4.3.6 总结181
第5 章 用数据驱动业务——AB 测试182
5.1 项目背景、目标和方案 182
5.1.1 项目背景 182
5.1.2 项目目标 183
5.1.3 项目方案 183
5.2 项目技术理论简介 183
5.2.1 自动化分流策略 183
5.2.2 整体评估指标185
5.2.3 概率论预备知识 186
5.2.4 假设检验 191
5.2.5 三个问题 197
5.3 项目实践 197
第6 章 变量筛选技术 204
6.1 项目背景、目标和方案 204
6.1.1 项目背景 204
6.1.2 项目目标 205
6.1.3 项目方案 205
6.2 项目技术理论简介 205
6.2.1 变量相关性 206
6.2.2 变量筛选 209
6.2.3 变量降维 215
6.2.4 R 语言实例代码 225
6.3 项目实践 237
6.3.1 变量筛选 238
6.3.2 变量降维 243
第7 章 构建用户画像系统 247
7.1 项目背景、目标和方案 247
7.1.1 项目背景 247
7.1.2 项目目标 248
7.1.3 项目方案 248
7.2 项目技术理论简介 248
7.2.1 用户画像的基本概念248
7.2.2 用户画像应用领域 249
7.2.3 用户画像分类250
7.2.4 用户画像构建250
7.2.5 用户画像标签的数值处理方法 254
7.3 项目实践 256
第8 章 从数据中寻找优质用户 261
8.1 项目背景、目标和方案 261
8.1.1 项目背景 261
8.1.2 项目目标 262
8.1.3 项目方案 262
8.2 项目技术理论简介 262
8.2.1 逻辑回归的基本概念262
8.2.2 建模流程 266
8.2.3 模型开发阶段269
8.2.4 模型验证阶段279
8.2.5 模型测试阶段285
8.2.6 商业应用流程288
8.2.7 R 语言实例代码 288
8.3 项目实践 295
8.3.1 数据探索 295
8.3.2 数据处理 297
8.3.3 建立模型 302
8.3.4 模型验证 304
8.3.5 总结308
第9 章 文本挖掘——点评数据展示策略309
9.1 项目背景、目标和方案 310
9.1.1 项目背景 310
9.1.2 项目目标 311
9.1.3 项目方案 311
9.2 项目技术理论简介 312
9.2.1 评论文本质量量化指标模型312
9.2.2 用户相似度模型 313
9.2.3 情感性分析 316
9.2.4 R 语言实例代码 321
9.3 项目实践 326
9.3.1 若干自定义函数 326
9.3.2 文本质量量化指标模型 329
9.3.3 用户相似度模型 334
9.3.4 情感性分析 335
9.3.5 总结340
1.1 互联网中的统计学 1
1.1.1 “互联网+”的发展 1
1.1.2 统计学的发展 2
1.1.3 大数据时代的统计学 2
1.2 R 语言——互联网与统计学的桥梁 3
1.3 本书结构5
第2 章 R 语言基础7
2.1 安装R 语言 7
2.1.1 获取和安装R 语言 7
2.1.2 安装RStudio 9
2.1.3 R 包 10
2.1.4 帮助 12
2.2 R 语言基本对象 12
2.2.1 数据类型12
2.2.2 向量 12
2.2.3 矩阵和数组19
2.2.4 列表 27
2.2.5 数据框 29
2.2.6 因子 32
2.2.7 数据类型的辨别和转换 39
2.2.8 数据类型和对象关系 39
2.3 工作空间和查看对象 40
2.3.1 工作空间和工作目录 40
2.3.2 遍历、创建、删除文件夹41
2.3.3 查看对象的方法 42
2.4 数据导入和导出 43
2.4.1 数据导入43
2.4.2 数据导出49
2.5 操作符和函数 51
2.5.1 操作符 51
2.5.2 函数 54
2.6 数据集操作59
2.6.1 变量操作60
2.6.2 数据集操作63
2.6.3 数据集连接67
2.6.4 数据汇总68
2.7 控制流71
2.7.1 重复和循环71
2.7.2 条件执行73
2.7.3 next 和break 74
2.8 自定义函数75
第3 章 互联网运营指标的建立 77
3.1 项目背景、目标及方案78
3.1.1 项目背景78
3.1.2 项目目标78
3.1.3 项目方案78
3.2 项目技术理论简介78
3.2.1 骨灰级流量指标 78
3.2.2 登录和激活80
2.2.3 访问深度和吸引力81
3.2.4 订单指标85
3.2.5 网站或APP 性能指标 86
3.2.6 转化率 87
3.2.7 层次分析法87
3.3 项目实践 92
3.3.1 搭建运营指标系统92
3.3.2 制作对比型指标及趋势线97
3.3.3 创建用户价值和活跃度指标101
第4 章 指标监控系统111
4.1 项目背景、目标及方案111
4.1.1 项目背景.111
4.1.2 项目目标.111
4.1.3 项目方案 112
4.2 项目技术理论简介 112
4.2.1 时间序列基本统计量112
4.2.2 数据观测与描述性统计 113
4.2.3 随机性 115
4.2.4 周期性 115
4.2.5 节假日模式识别 115
4.2.6 建模数据集的建立 118
4.2.7 指标监控方法(不含节假日) 125
4.2.8 节假日指标监控方法134
4.2.9 R 语言实例代码 135
4.3 项目实践 141
4.3.1 数据概览 142
4.3.2 节假日模式识别 145
4.3.3 模型数据集的建立 155
4.3.4 指标监控(非节假日) 160
4.3.5 节假日指标监控 176
4.3.6 总结181
第5 章 用数据驱动业务——AB 测试182
5.1 项目背景、目标和方案 182
5.1.1 项目背景 182
5.1.2 项目目标 183
5.1.3 项目方案 183
5.2 项目技术理论简介 183
5.2.1 自动化分流策略 183
5.2.2 整体评估指标185
5.2.3 概率论预备知识 186
5.2.4 假设检验 191
5.2.5 三个问题 197
5.3 项目实践 197
第6 章 变量筛选技术 204
6.1 项目背景、目标和方案 204
6.1.1 项目背景 204
6.1.2 项目目标 205
6.1.3 项目方案 205
6.2 项目技术理论简介 205
6.2.1 变量相关性 206
6.2.2 变量筛选 209
6.2.3 变量降维 215
6.2.4 R 语言实例代码 225
6.3 项目实践 237
6.3.1 变量筛选 238
6.3.2 变量降维 243
第7 章 构建用户画像系统 247
7.1 项目背景、目标和方案 247
7.1.1 项目背景 247
7.1.2 项目目标 248
7.1.3 项目方案 248
7.2 项目技术理论简介 248
7.2.1 用户画像的基本概念248
7.2.2 用户画像应用领域 249
7.2.3 用户画像分类250
7.2.4 用户画像构建250
7.2.5 用户画像标签的数值处理方法 254
7.3 项目实践 256
第8 章 从数据中寻找优质用户 261
8.1 项目背景、目标和方案 261
8.1.1 项目背景 261
8.1.2 项目目标 262
8.1.3 项目方案 262
8.2 项目技术理论简介 262
8.2.1 逻辑回归的基本概念262
8.2.2 建模流程 266
8.2.3 模型开发阶段269
8.2.4 模型验证阶段279
8.2.5 模型测试阶段285
8.2.6 商业应用流程288
8.2.7 R 语言实例代码 288
8.3 项目实践 295
8.3.1 数据探索 295
8.3.2 数据处理 297
8.3.3 建立模型 302
8.3.4 模型验证 304
8.3.5 总结308
第9 章 文本挖掘——点评数据展示策略309
9.1 项目背景、目标和方案 310
9.1.1 项目背景 310
9.1.2 项目目标 311
9.1.3 项目方案 311
9.2 项目技术理论简介 312
9.2.1 评论文本质量量化指标模型312
9.2.2 用户相似度模型 313
9.2.3 情感性分析 316
9.2.4 R 语言实例代码 321
9.3 项目实践 326
9.3.1 若干自定义函数 326
9.3.2 文本质量量化指标模型 329
9.3.3 用户相似度模型 334
9.3.4 情感性分析 335
9.3.5 总结340