我爱电子书-《机器学习与R语言: 数据科学与工程技术丛书》| pdf + epub + mobi + awz3, 高清版, 带目录，Kindle版, 多看精排版下载

注重体验与质量的电子书资源下载网站

分类于: 计算机基础人工智能

简介

机器学习与R语言: 数据科学与工程技术丛书豆 8.4分

资源最后更新于 2020-03-29 03:04:32

作者：〔美〕兰兹（Brett Lantz）

译者：李洪成许金炜李舰

出版社：出版社机械工业出版社

出版日期：2015-02

ISBN：9787111491576

文件格式： pdf

标签：程序设计机器学习程序语言数据科学与工程技术丛书

简介· · · · · ·

本书共分12章。第1章介绍机器学习的基本概念和理论，并介绍用于机器学习的R软件环境的准备。第2章介绍如何应用R来管理数据，进行数据的探索分析和数据可视化。第3章到第9章介绍典型的机器学习算法和案例，包括：k近邻分类算法、朴素贝叶斯算法、决策树和规则树、回归预测、黑盒算法——神经网络和支持向量机、关联分析、k均值聚类。伴随着这些算法的介绍，书中给出了大量的实际案例，并给出了详细的分析步骤，例如乳腺癌的判断、垃圾短信的过滤、贷款违约的预测、毒蘑菇的判别、医疗费用的预测、建筑用混凝土强度的预测、光学字符的识别、超市购物篮关联分析以及市场细分等。第10章介绍模型性能评价的原理和方法。第11章给出提高模型性能的几种常用方法。第12章讨论用R进行机器学习时可能遇到的一些高级专题，例如特殊形式的数据、大数据集的处理、并行计算和CPU计算等技术。作者：兰兹（Brett Lantz）。译者：李洪成，许金炜，李舰。

直接下载

简介

机器学习与R语言: 数据科学与工程技术丛书 豆 8.4分

简介· · · · · ·

目录

推荐序

译者序

前言

致谢

关于技术评审人

第1章 机器学习简介

1.1 机器学习的起源

1.2 机器学习的使用与滥用

1.3 机器如何学习

1.3.1 抽象化和知识表达

1.3.2 一般化

1.3.3 评估学习的成功性

1.4 将机器学习应用于数据中的步骤

1.5 选择机器学习算法

1.5.1 考虑输入的数据

1.5.2 考虑机器学习算法的类型

1.5.3 为数据匹配合适的算法

1.6 使用R进行机器学习

1.7 总结

第2章 数据的管理和理解

2.1 R数据结构

2.2 向量

2.3 因子

2.3.1 列表

2.3.2 数据框

2.3.3 矩阵和数组

2.4 用R管理数据

2.4.1 保存和加载R数据结构

2.4.2 用CSV文件导入和保存数据

2.4.3 从SQL数据库导入数据

2.5 探索和理解数据

2.5.1 探索数据的结构

2.5.2 探索数值型变量

2.5.3 探索分类变量

2.5.4 探索变量之间的关系

2.6 总结

第3章 懒惰学习——使用近邻分类

3.1 理解使用近邻进行分类

3.1.1 kNN算法

3.1.2 为什么kNN算法是懒惰的

3.2 用kNN算法诊断乳腺癌

3.2.1 第1步——收集数据

3.2.2 第2步——探索和准备数据

3.2.3 第3步——基于数据训练模型

3.2.4 第4步——评估模型的性能

3.2.5 第5步——提高模型的性能

3.3 总结

第4章 概率学习——朴素贝叶斯分类

4.1 理解朴素贝叶斯

4.1.1 贝叶斯方法的基本概念

4.1.2 朴素贝叶斯算法

4.2 例子——基于贝叶斯算法的手机垃圾短信过滤

4.2.1 第1步——收集数据

4.2.2 第2步——探索和准备数据

4.2.3 数据准备——处理和分析文本数据

4.2.4 第3步——基于数据训练模型

4.2.5 第4步——评估模型的性能

4.2.6 第5步——提升模型的性能

4.3 总结

第5章 分而治之——应用决策树和规则进行分类

5.1 理解决策树

5.1.1 分而治之

5.1.2 C5.0决策树算法

5.2 例子——使用C5.0决策树识别高风险银行贷款

5.2.1 第1步——收集数据

5.2.2 第2步——探索和准备数据

5.2.3 第3步——基于数据训练模型

5.2.4 第4步——评估模型的性能

5.2.5 第5步——提高模型的性能

5.3 理解分类规则

5.3.1 独立而治之

5.3.2 单规则（1R）算法

5.3.3 RIPPER算法

5.3.4 来自决策树的规则

5.4 例子——应用规则学习识别有毒的蘑菇

5.4.1 第1步——收集数据

机器学习与R语言: 数据科学与工程技术丛书豆 8.4分

第1章　机器学习简介

1.1　机器学习的起源

1.2　机器学习的使用与滥用

1.3　机器如何学习

1.3.1　抽象化和知识表达

1.3.2　一般化

1.3.3　评估学习的成功性

1.4　将机器学习应用于数据中的步骤

1.5　选择机器学习算法

1.5.1　考虑输入的数据

1.5.2　考虑机器学习算法的类型

1.5.3　为数据匹配合适的算法

1.6　使用R进行机器学习

1.7　总结

第2章　数据的管理和理解

2.1　R数据结构

2.2　向量

2.3　因子

2.3.1　列表

2.3.2　数据框

2.3.3　矩阵和数组

2.4　用R管理数据

2.4.1　保存和加载R数据结构

2.4.2　用CSV文件导入和保存数据

2.4.3　从SQL数据库导入数据

2.5　探索和理解数据

2.5.1　探索数据的结构

2.5.2　探索数值型变量

2.5.3　探索分类变量

2.5.4　探索变量之间的关系

2.6　总结

第3章　懒惰学习——使用近邻分类

3.1　理解使用近邻进行分类

3.1.1　kNN算法

3.1.2　为什么kNN算法是懒惰的

3.2　用kNN算法诊断乳腺癌

3.2.1　第1步——收集数据

3.2.2　第2步——探索和准备数据

3.2.3　第3步——基于数据训练模型

3.2.4　第4步——评估模型的性能

3.2.5　第5步——提高模型的性能

3.3　总结

第4章　概率学习——朴素贝叶斯分类

4.1　理解朴素贝叶斯

4.1.1　贝叶斯方法的基本概念

4.1.2　朴素贝叶斯算法

4.2　例子——基于贝叶斯算法的手机垃圾短信过滤

4.2.1　第1步——收集数据

4.2.2　第2步——探索和准备数据

4.2.3　数据准备——处理和分析文本数据

4.2.4　第3步——基于数据训练模型

4.2.5　第4步——评估模型的性能

4.2.6　第5步——提升模型的性能

4.3　总结

第5章　分而治之——应用决策树和规则进行分类

5.1　理解决策树

5.1.1　分而治之

5.1.2　C5.0决策树算法

5.2　例子——使用C5.0决策树识别高风险银行贷款

5.2.1　第1步——收集数据

5.2.2　第2步——探索和准备数据

5.2.3　第3步——基于数据训练模型

5.2.4　第4步——评估模型的性能

5.2.5　第5步——提高模型的性能

5.3　理解分类规则

5.3.1　独立而治之

5.3.2　单规则（1R）算法

5.3.3　RIPPER算法

5.3.4　来自决策树的规则

5.4　例子——应用规则学习识别有毒的蘑菇

5.4.1　第1步——收集数据

5.4.2　第2步——探索和准备数据

5.4.3　第3步——基于数据训练模型

5.4.4　第4步——评估模型的性能

5.4.5　第5步——提高模型的性能

5.5　总结

第6章　预测数值型数据——回归方法

6.1　理解回归

6.1.1　简单线性回归