我爱电子书-《Python数据挖掘: 概念、方法与实践》| pdf + epub + mobi + awz3, 高清版, 带目录，Kindle版, 多看精排版下载

注重体验与质量的电子书资源下载网站

分类于: 编程语言计算机基础互联网云计算&大数据

简介

Python数据挖掘: 概念、方法与实践豆 0.0分

资源最后更新于 2020-03-29 02:20:28

作者：〔美〕梅甘·斯夸尔（Megan Squire）

译者：姚军

出版社：出版社机械工业出版社

出版日期：2017-04

文件格式： pdf

标签：互联网计算机编程外国程序设计软件

简介· · · · · ·

本书的目标是向具有一定基础的数据分析人员介绍实践中最为常见而在一般数据挖掘书籍中又难以见到的技术与概念，用真实项目、在通用编程环境Python中介绍数据挖掘方法。对于每种方法，书中不仅有对概念的详细解说，还有程序实例、替代方法以及每种方法效能的评估技术，真正帮助读者“知其然，知其所以然”，从而迈向数据挖掘专家的道路。在本书的翻译过程中，我们不仅见识了数据挖掘领域的博大精深，感叹于现代数据分析技术的快速发展，而且在浅显易懂的真实项目引导下，利用许多研究人员精心打造的“神器”，轻松地得到以前难以企及的结果。可以想象，认真阅读本书，读者在增长知识的同时，也将对精通数据挖掘充满信心，可能将其作为未来的一个工作方向。《Python数据挖掘：概念、方法与实践》由【美】梅甘·斯夸尔著，由姚军译。

直接下载

简介

Python数据挖掘: 概念、方法与实践 豆 0.0分

简介· · · · · ·

目录

译者序

关于审稿人

前言

第1章 扩展你的数据挖掘工具箱

1.1 什么是数据挖掘

1.2 如何进行数据挖掘

1.2.1 Fayyad等人的KDD过程

1.2.2 韩家炜等人的KDD过程

1.2.3 CRISP-DM过程

1.2.4 六步过程

1.2.5 哪一种数据挖掘方法最好

1.3 在数据挖掘中使用哪些技术

1.4 如何建立数据挖掘工作环境

1.5 小结

第2章 关联规则挖掘

2.1 什么是频繁项集

2.1.1 都市传奇“尿布与啤酒”

2.1.2 频繁项集挖掘基础知识

2.2 迈向关联规则

2.2.1 支持度

2.2.2 置信度

2.2.3 关联规则

2.2.4 包含数据的示例

2.2.5 附加值——修复计划中的漏洞

2.2.6 寻找频繁项集的方法

2.3 项目——发现软件项目标签中的关联规则

2.4 小结

第3章 实体匹配

3.1 什么是实体匹配

3.1.1 数据合并

3.1.2 匹配技术

3.1.3 基于属性的相似度匹配

3.1.4 属性匹配方法

3.1.5 利用不相交数据集

3.1.6 基于上下文的相似度匹配

3.1.7 基于机器学习的实体匹配

3.1.8 实体匹配技术的评估

3.2 实体匹配项目

3.2.1 软件项目匹配的难度

3.2.2 两个例子

3.2.3 根据项目名称匹配

3.2.4 根据人名匹配

3.2.5 根据URL匹配

3.2.6 按照主题和描述关键词匹配

3.2.7 数据集

3.2.8 代码

3.2.9 结果

3.3 小结

第4章 网络分析

4.1 什么是网络

4.2 网络计量

4.2.1 网络的度数

4.2.2 网络直径

4.2.3 网络中的通路、路径和迹

4.2.4 网络的成分

4.2.5 图的中心性

4.3 图数据的表示

4.3.1 邻接矩阵

4.3.2 边表和邻接表

4.3.3 图数据结构之间的差别

4.3.4 将数据导入图结构中

4.4 真实项目

4.4.1 探索数据

4.4.2 生成网络文件

4.4.3 以网络的形式理解数据

4.5 小结

第5章 文本情绪分析

5.1 什么是情绪分析

5.2 情绪分析基础知识

5.2.1 观点的结构

5.2.2 文档级和句子级分析

5.2.3 观点的重要特征

5.3 情绪分析算法

5.4 情绪挖掘应用

5.4.1 项目动机

5.4.2 数据准备

Python数据挖掘: 概念、方法与实践豆 0.0分

第1章　扩展你的数据挖掘工具箱

1.1　什么是数据挖掘

1.2　如何进行数据挖掘

1.2.1　Fayyad等人的KDD过程

1.2.2　韩家炜等人的KDD过程

1.2.3　CRISP-DM过程

1.2.4　六步过程

1.2.5　哪一种数据挖掘方法最好

1.3　在数据挖掘中使用哪些技术

1.4　如何建立数据挖掘工作环境

1.5　小结

第2章　关联规则挖掘

2.1　什么是频繁项集

2.1.1　都市传奇“尿布与啤酒”

2.1.2　频繁项集挖掘基础知识

2.2　迈向关联规则

2.2.1　支持度

2.2.2　置信度

2.2.3　关联规则

2.2.4　包含数据的示例

2.2.5　附加值——修复计划中的漏洞

2.2.6　寻找频繁项集的方法

2.3　项目——发现软件项目标签中的关联规则

2.4　小结

第3章　实体匹配

3.1　什么是实体匹配

3.1.1　数据合并

3.1.2　匹配技术

3.1.3　基于属性的相似度匹配

3.1.4　属性匹配方法

3.1.5　利用不相交数据集

3.1.6　基于上下文的相似度匹配

3.1.7　基于机器学习的实体匹配

3.1.8　实体匹配技术的评估

3.2　实体匹配项目

3.2.1　软件项目匹配的难度

3.2.2　两个例子

3.2.3　根据项目名称匹配

3.2.4　根据人名匹配

3.2.5　根据URL匹配

3.2.6　按照主题和描述关键词匹配

3.2.7　数据集

3.2.8　代码

3.2.9　结果

3.3　小结

第4章　网络分析

4.1　什么是网络

4.2　网络计量

4.2.1　网络的度数

4.2.2　网络直径

4.2.3　网络中的通路、路径和迹

4.2.4　网络的成分

4.2.5　图的中心性

4.3　图数据的表示

4.3.1　邻接矩阵

4.3.2　边表和邻接表

4.3.3　图数据结构之间的差别

4.3.4　将数据导入图结构中

4.4　真实项目

4.4.1　探索数据

4.4.2　生成网络文件

4.4.3　以网络的形式理解数据

4.5　小结

第5章　文本情绪分析

5.1　什么是情绪分析

5.2　情绪分析基础知识

5.2.1　观点的结构

5.2.2　文档级和句子级分析

5.2.3　观点的重要特征

5.3　情绪分析算法

5.4　情绪挖掘应用

5.4.1　项目动机

5.4.2　数据准备

5.4.3　聊天消息的数据分析

5.4.4　电子邮件消息的数据分析

5.5　小结

第6章　文本中的命名实体识别

6.1　为什么寻找命名实体？

6.2　命名实体识别技术