我爱电子书-《数据科学导论: Python语言实现》| pdf + epub + mobi + awz3, 高清版, 带目录，Kindle版, 多看精排版下载

注重体验与质量的电子书资源下载网站

分类于: 编程语言计算机基础云计算&大数据

简介

数据科学导论: Python语言实现豆 0.0分

资源最后更新于 2020-03-29 02:13:41

作者：〔意〕阿尔贝托·博斯凯蒂（Alberto Boschetti）

译者：于俊伟靳小波

出版社：出版社机械工业出版社

出版日期：2016-07

文件格式： pdf

标签：计算机编程 Python 数据科学与工程技术丛书

简介· · · · · ·

我们正处于一个快速发展的信息化时代，人们每天都在生产着各种类型的数据，与此同时，数据也在极大地影响着我们的生活。于是，数据成为与能源同等重要的资源。掌握了数据获取、处理、建模、分析等过程的理论和方法，无疑就是掌握了打开这种新型资源的钥匙。数据科学是融合多种学科的新的知识领域，一般要求学习者或从业者具备统计学等数学知识、计算机相关学科专业知识和特定业务领域的知识。目前，数据科学领域的研究和应用备受瞩目，吸引了众多研究者、实践者和从业者的参与，他们都在积极探索数据科学的基本理论、研究方法和技术应用。

直接下载

简介

数据科学导论: Python语言实现 豆 0.0分

简介· · · · · ·

目录

译者序

前言

第1章 新手上路

1.1 数据科学与Python简介

1.2 Python的安装

1.2.1 Python 2还是Python 3

1.2.2 分步安装

1.2.3 Python核心工具包一瞥

1.2.4 工具包的安装

1.2.5 工具包升级

1.3 科学计算发行版

1.3.1 Anaconda

1.3.2 Enthought Canopy

1.3.3 PythonXY

1.3.4 WinPython

1.4 IPython简介

1.4.1 IPython Notebook

1.4.2 本书使用的数据集和代码

1.5 小结

第2章 数据改写

2.1 数据科学过程

2.2 使用pandas进行数据加载与预处理

2.2.1 数据快捷加载

2.2.2 处理问题数据

2.2.3 处理大数据集

2.2.4 访问其他数据格式

2.2.5 数据预处理

2.2.6 数据选择

2.3 使用分类数据和文本数据

2.4 使用NumPy进行数据处理

2.4.1 NumPy中的N维数组

2.4.2 NumPy ndarray对象基础

2.5 创建NumPy数组

2.5.1 从列表到一维数组

2.5.2 控制内存大小

2.5.3 异构列表

2.5.4 从列表到多维数组

2.5.5 改变数组大小

2.5.6 利用NumPy函数生成数组

2.5.7 直接从文件中获得数组

2.5.8 从pandas提取数据

2.6 NumPy快速操作和计算

2.6.1 矩阵运算

2.6.2 NumPy数组切片和索引

2.6.3 NumPy数组堆叠

2.7 小结

第3章 数据科学流程

3.1 EDA简介

3.2 特征创建

3.3 维数约简

3.3.1 协方差矩阵

3.3.2 主成分分析

3.3.3 一种用于大数据的PCA变型——Randomized PCA

3.3.4 潜在因素分析

3.3.5 线性判别分析

3.3.6 潜在语义分析

3.3.7 独立成分分析

3.3.8 核主成分分析

3.3.9 受限玻耳兹曼机

3.4 异常检测和处理

3.4.1 单变量异常检测

3.4.2 EllipticEnvelope

3.4.3 OneClassSVM

3.5 评分函数

3.5.1 多标号分类

3.5.2 二值分类

3.5.3 回归

3.6 测试和验证

3.7 交叉验证

3.7.1 使用交叉验证迭代器

3.7.2 采样和自举方法

3.8 超参数优化

3.8.1 建立自定义评分函数

3.8.2 减少网格搜索时间

3.9 特征选择

3.9.1 单变量选择

数据科学导论: Python语言实现豆 0.0分

第1章　新手上路

1.1　数据科学与Python简介

1.2　Python的安装

1.2.1　Python 2还是Python 3

1.2.2　分步安装

1.2.3　Python核心工具包一瞥

1.2.4　工具包的安装

1.2.5　工具包升级

1.3　科学计算发行版

1.3.1　Anaconda

1.3.2　Enthought Canopy

1.3.3　PythonXY

1.3.4　WinPython

1.4　IPython简介

1.4.1　IPython Notebook

1.4.2　本书使用的数据集和代码

1.5　小结

第2章　数据改写

2.1　数据科学过程

2.2　使用pandas进行数据加载与预处理

2.2.1　数据快捷加载

2.2.2　处理问题数据

2.2.3　处理大数据集

2.2.4　访问其他数据格式

2.2.5　数据预处理

2.2.6　数据选择

2.3　使用分类数据和文本数据

2.4　使用NumPy进行数据处理

2.4.1　NumPy中的N维数组

2.4.2　NumPy ndarray对象基础

2.5　创建NumPy数组

2.5.1　从列表到一维数组

2.5.2　控制内存大小

2.5.3　异构列表

2.5.4　从列表到多维数组

2.5.5　改变数组大小

2.5.6　利用NumPy函数生成数组

2.5.7　直接从文件中获得数组

2.5.8　从pandas提取数据

2.6　NumPy快速操作和计算

2.6.1　矩阵运算

2.6.2　NumPy数组切片和索引

2.6.3　NumPy数组堆叠

2.7　小结

第3章　数据科学流程

3.1　EDA简介

3.2　特征创建

3.3　维数约简

3.3.1　协方差矩阵

3.3.2　主成分分析

3.3.3　一种用于大数据的PCA变型——Randomized PCA

3.3.4　潜在因素分析

3.3.5　线性判别分析

3.3.6　潜在语义分析

3.3.7　独立成分分析

3.3.8　核主成分分析

3.3.9　受限玻耳兹曼机

3.4　异常检测和处理

3.4.1　单变量异常检测

3.4.2　EllipticEnvelope

3.4.3　OneClassSVM

3.5　评分函数

3.5.1　多标号分类

3.5.2　二值分类

3.5.3　回归

3.6　测试和验证

3.7　交叉验证

3.7.1　使用交叉验证迭代器

3.7.2　采样和自举方法

3.8　超参数优化

3.8.1　建立自定义评分函数

3.8.2　减少网格搜索时间

3.9　特征选择

3.9.1　单变量选择

3.9.2　递归消除

3.9.3　稳定性选择与基于L1的选择

3.10　小结

第4章　机器学习

4.1　线性和逻辑回归