logo
分类于: 人工智能 云计算&大数据

简介

数据分析实战: 基于EXCEL和SPSS系列工具的实践

数据分析实战: 基于EXCEL和SPSS系列工具的实践 6.7分

资源最后更新于 2020-11-20 04:29:08

作者:纪贺元

出版社:机械工业出版社

出版日期:2017-01

ISBN:9787111566670

文件格式: pdf

标签: 数据分析 spss excel 工具 豆瓣推荐 纪贺元 机械工业出版社 产品经理

简介· · · · · ·

本书是针对于非统计科班出身的企业人员讲述数据分析和挖掘的著作,也是诸多数据挖掘书籍中为数不多的穿插大量真实实践应用案例和场景的著作。全书分为三大部分:

第一部分是基础篇(第1章和第2章),主要介绍数据分析的概念、术语、方法、模型等,为后续的内容展开奠定基础。

第二部分是制表篇(第3章~第5章),介绍数据的采集原则、数据整理以及常用数据报表的制作方法和技巧。

第三部分是数据分析篇(第6章~第14章),这是本书的重点内容,囊括了从数据扫描、数据标注到异常值分析、回归等常用的、有代表性的功能,并以案例形式展示在数据分析过程中使用上述功能的思路、方法和技巧,指导读者进行实战操练。

想要: 点击会收藏到你的 我的收藏,可以在这里查看

已收: 表示已经收藏

Tips: 注册一个用户 可以通过用户中心得到电子书更新的通知哦

目录

前言
第1章 什么是数据分析1
1.1 一眼就看到结论还需要数据分析吗1
1.1.1 企业数据量2
1.1.2 数据复杂度2
1.1.3 数据颗粒度3
1.2 数据分析能给我们带来什么4
1.2.1 了解数据的整体状况4
1.2.2 快速查询数据5
1.2.3 数据之间关系的探索5
1.2.4 业务预测6
1.3 数据分析的几大抓手6
1.3.1 足够多的数据6
1.3.2 数据质量6
1.3.3 合适的工具7
1.3.4 分析结果的呈现7
1.4 数据分析的流程7
1.4.1 数据采集7
1.4.2 数据整理8
1.4.3 制表11
1.4.4 数据分析11
1.4.5 数据展示(呈现)12
1.5 如何成为数据分析高手12
1.5.1 “拳不离手,曲不离口”12
1.5.2 熟练掌握常用工具12
1.5.3 最好能编点程序13
1.5.4 一定要通晓业务14
第2章 数据分析的理论、工具、模型15
2.1 基本概念和术语15
2.1.1 基本概念15
2.1.2 术语22
2.2 选择称手的软件工具26
2.2.1 EXCEL27
2.2.2 VBA27
2.2.3 Access27
2.2.4 SPSS28
2.2.5 XLSTAT29
2.2.6 Modeler29
2.2.7 R语言30
2.3 在分析需求和模型之间搭起桥梁30
2.3.1 识别需求30
2.3.2 分解需求30
2.3.3 选择工具和模型31
第3章 数据采集与整理32
3.1 数据采集的几条重要原则32
3.1.1 要足够“复杂”32
3.1.2 要足够“细”33
3.1.3 要有“跨度”33
3.1.4 要有可行性34
3.2 用“逐步推进法”推测需要的数据34
3.3 耗时耗力的数据整理过程35
3.3.1 重复、空行、空列数据删除36
3.3.2 缺失值的填充和分析39
3.3.3 数据间逻辑的排查45
3.4 数据量太大了怎么办47
3.4.1 放到数据库中处理47
3.4.2 用专业工具处理47
3.4.3 数据抽样51
第4章 数据分析的基础:制表(上)53
4.1 以数据合并为目标的制表53
4.1.1 跨工作表合并53
4.1.2 跨工作簿合并55
4.2 以数据筛选为目标的制表56
4.2.1 普通数据筛选57
4.2.2 高级筛选60
4.2.3 计算筛选62
4.2.4 函数筛选63
4.3 以获得概要数据为目标的制表64
4.3.1 分类汇总方法64
4.3.2 数据透视表汇总68
第5章 数据分析的基础:制表(下)70
5.1 “七个百分比”让你懂得大部分表格类型70
5.1.1 行总计的百分比70
5.1.2 列总计的百分比73
5.1.3 全部总计的百分比74
5.1.4 父行(列)的百分比74
5.1.5 累计占比75
5.1.6 环比78
5.1.7 同比79
5.2 分组功能经常让分析峰回路转81
5.2.1 文本的分组81
5.2.2 等步长的数据分组83
5.2.3 不等步长的数据分组86
5.2.4 日期型的分组88
5.3 随意生成各种派生指标89
5.3.1 添加字段89
5.3.2 添加项91
5.4 从大数据库中挑选要分析的数据:Microsoft Query92
5.5 强大的SQL97
5.5.1 SQL的基本语法97
5.5.2 SQL的应用97
第6章 数据扫描:给数据做体检100
6.1 在EXCEL中给数据做扫描100
6.2 SPSS中给数据做扫描103
6.3 在Modeler中给数据做扫描105
6.4 其他相应的指标108
第7章 数据标注:给数据上色110
7.1 大数据块的整体标注111
7.1.1 突出显示单元格规则111
7.1.2 特殊数据选取规则112
7.2 根据业务逻辑在数据中标注上色113
7.2.1 数据条、色阶、图标集的应用113
7.2.2 规则的理解115
7.2.3 根据业务需求改变规则118
7.3 采用公式实现复杂强大的数据标注119
7.3.1 理解逻辑表达式的含义119
7.3.2 复杂逻辑公式的应用120
7.4 如何在一张表格中实现多种标注规则123
7.4.1 多规则的应用123
7.4.2 如何理解“遇真则停止”125
第8章 找到数据中的“特殊分子”127
8.1 什么是异常值127
8.2 异常值的判断标准128
8.3 用绘图技巧找到异常值129
8.3.1 散点图129
8.3.2 面板图130
8.4 用公式函数法发掘异常值135
8.5 三倍标准差法137
第9章 相关分析与决策树140
9.1 Pearson相关140
9.1.1 应用场景141
9.1.2 输出指标的解析141
9.2 典型相关分析145
9.2.1 操作步骤145
9.2.2 结果解读147
9.3 决策树149
9.3.1 什么时候需要用决策树149
9.3.2 决策树的操作和指标解释150
第10章 聚类155
10.1 多维度数据的分类怎么办155
10.1.1 低维度数据的分类方法155
10.1.2 高维度数据的分类需求157
10.1.3 常用的聚类操作介绍157
10.2 聚类的烦恼1:如何面对数量级差别大的数据165
10.3 聚类的烦恼2:如何判断聚类的质量167
第11章 回归168
11.1 如何寻找现有数据的内在规律168
11.1.1 什么是数据拟合169
11.1.2 多元线性回归171
11.2 logistic回归173
11.2.1 回归(客户“买”与“不买”)173
11.2.2 多元logistic回归(多个品牌的选择)176
11.2.3 多元有序logistic回归181
第12章 关联分析183
12.1 因果关系的弱化183
12.2 关联分析的指标184
12.2.1 支持度184
12.2.2 置信度185
12.2.3 提升度185
12.3 什么样的数据适合做关联分析186
12.3.1 商超数据186
12.3.2 金融数据186
12.3.3 生产质量数据187
12.4 关联分析的具体操作187
第13章 预测191
13.1 什么是预测,预测的准确度高吗191
13.2 移动平滑193
13.3 指数平滑194
13.3.1 二次指数平滑194
13.3.2 三次指数平滑195
13.4 对周期性数据的分解198
13.5 ARIMA预测法201
第14章 高级绘图技巧206
14.1 怎样才算图画得好206
14.2 双轴图的技巧和运用207
14.3 不同数量级数据的高效对比展示211
14.4 数据标签的妙用215
14.5 图形中的重点标注221
14.6 绘图美学—多点审美素养222
14.6.1 整体布局222
14.6.2 线型的选择223
14.6.3 色彩对比223
后记 数据分析经验之我见224