注重体验与质量的电子书资源下载网站
分类于: 其它 编程语言
简介
最简数据挖掘 豆 0.0分
资源最后更新于 2020-10-05 18:40:32
作者:周涛
出版社:电子工业出版社
出版日期:2020-01
ISBN:9787121359637
文件格式: pdf
简介· · · · · ·
本书是数据挖掘精髓的浓缩。章用通俗易懂的语言回答五个基本问题,包括什么是数据,什么是大数据,什么是数据挖掘,以及数据挖掘能挖掘出哪些东西和会产生什么价值。然后用6章的篇幅介绍k-均值、k-近邻、朴素贝叶斯、决策树、回归分析和关联规则挖掘等6种方法。第8章介绍一些实际的应用,演示简单的数据挖掘方法如何产生巨大的价值。本书可供高校的数据科学与大数据、智能科学与技术、人工智能、计算机科学与技术和统计类、应用数学等相关专业的学生作为教材使用,也可供高校的商科大数据、金融等专业的学生、的中学生、科技企业的管理者和相关行业的投资人学习参考。
目录
概述
1.1 什么是数据
1.2 什么是大数据
1.3 什么是数据挖掘
1.4 能挖掘出什么
1.5 会产生什么价值
第2章 k-均值
2.1 基本算法
2.2 k-均值示例
2.3 k-均值算法的局限性
练习赛
第3章 k-近邻
3.1 k-近邻基本算法
3.2 评价分类效果的常见指标
3.3 影响算法精确度的若干问题
3.4 k-近邻算法示例
练习赛
第4章 朴素贝叶斯
4.1 贝叶斯定理
4.2 贝叶斯基本算法
4.3 贝叶斯算法案例
4.4 处理连续特征
练习赛
第5章 回归
5.1 线性回归的简示例
5.2 线性回归的一般形式
5.3 逻辑回归的简示例
5.4 逻辑回归的一般形式
5.5 小结和讨论
练习赛
第6章 决策树
6.1 构建决策树
6.2 经典决策树:ID3、C4.5和CART
6.3 连续值、缺失值和剪枝
6.4 小结和讨论
练习赛
第7章 关联规则挖掘
7.1 基本算法思想
7.2 Apriori算法示例
7.3 小结和讨论
练习赛
第8章 数据挖掘应用创新案例
8.1 提升生产制造过程的良品率
8.2 刻画化对碳排放的影响
8.3 捕捉电商评论中的用户情感
8.4 实时发现微博中的热点事件
推荐阅读材料
1.1 什么是数据
1.2 什么是大数据
1.3 什么是数据挖掘
1.4 能挖掘出什么
1.5 会产生什么价值
第2章 k-均值
2.1 基本算法
2.2 k-均值示例
2.3 k-均值算法的局限性
练习赛
第3章 k-近邻
3.1 k-近邻基本算法
3.2 评价分类效果的常见指标
3.3 影响算法精确度的若干问题
3.4 k-近邻算法示例
练习赛
第4章 朴素贝叶斯
4.1 贝叶斯定理
4.2 贝叶斯基本算法
4.3 贝叶斯算法案例
4.4 处理连续特征
练习赛
第5章 回归
5.1 线性回归的简示例
5.2 线性回归的一般形式
5.3 逻辑回归的简示例
5.4 逻辑回归的一般形式
5.5 小结和讨论
练习赛
第6章 决策树
6.1 构建决策树
6.2 经典决策树:ID3、C4.5和CART
6.3 连续值、缺失值和剪枝
6.4 小结和讨论
练习赛
第7章 关联规则挖掘
7.1 基本算法思想
7.2 Apriori算法示例
7.3 小结和讨论
练习赛
第8章 数据挖掘应用创新案例
8.1 提升生产制造过程的良品率
8.2 刻画化对碳排放的影响
8.3 捕捉电商评论中的用户情感
8.4 实时发现微博中的热点事件
推荐阅读材料