我爱电子书-《数据科学导论：Python语言实现（原书第2版）: 数据科学与工程技术丛书》| pdf + epub + mobi + awz3, 高清版, 带目录，Kindle版, 多看精排版下载

注重体验与质量的电子书资源下载网站

分类于: 互联网云计算&大数据职场办公

简介

数据科学导论：Python语言实现（原书第2版）: 数据科学与工程技术丛书豆 0.0分

资源最后更新于 2020-03-29 02:14:26

作者：〔意〕阿尔贝托·博斯凯蒂（Alberto Boschetti）〔意〕卢卡·马萨罗（Luca Massaron）

译者：于俊伟靳小波

出版社：出版社机械工业出版社

出版日期：2018-03

ISBN：9787111589860

文件格式： pdf

标签：互联网外国文学编程语言数据数据科学与工程技术丛书

简介· · · · · ·

本书首先介绍了如何在Python3.5中安装必要的数据科学工具箱；然后引导你进入数据改写和预处理阶段，在其中阐述用于数据分析、探索或处理的数据加载、变换和修复等关键的数据科学活动；后，通过介绍主要的机器学习算法、图分析技术和可视化方法来对数据科学进行概述。阿尔贝托·博斯凯蒂（Alberto Boschetti）数据科学家、信号处理和统计学方面的专家。他是通信工程专业博士，现在伦敦居住和工作。他主要从事自然语言处理、行为分析、机器学习和分布式处理等方面的挑战性工作。他对工作充满激情，经常参加学术聚会、研讨会及其他学术活动，紧跟数据科学技术发展的前沿。我要感谢我的家人、朋友和同事！同时，也非常感谢开源社区！卢卡·马萨罗（Luca Massaron）数据科学家、市场营销研究主导者，是多变量统计分析、机器学习和客户洞察方面的专家。有十年以上解决实际问题的经验，使用推理、统计、数据挖掘和算法为利益相关者创造了巨大的价值。在意大利他是网络受众分析的先锋，并在Kaggler上获得排名前十的佳绩，随后一直热心参与各种与数据及数据分析相关的活动，积极给新手和专业人员讲解数据驱动知识发现的潜力。他崇尚大道至简，坚信理解数据科学的精要能给你带来巨大收获。致Yukiko和Amelia，谢谢你们的爱和包容。“前路无止境，星云作伴长，双脚虽远行，终归还家乡。”

直接下载

简介

数据科学导论：Python语言实现（原书第2版）: 数据科学与工程技术丛书 豆 0.0分

简介· · · · · ·

目录

译者序

前言

作者简介

第1章 新手上路

1.1 数据科学与Python简介

1.2 Python的安装

1.2.1 Python 2还是Python 3

1.2.2 分步安装

1.2.3 工具包的安装

1.2.4 工具包升级

1.2.5 科学计算发行版

1.2.6 虚拟环境

1.2.7 核心工具包一瞥

1.3 Jupyter简介

1.3.1 快速安装与初次使用

1.3.2 Jupyter魔术命令

1.3.3 Jupyter Notebook怎样帮助数据科学家

1.3.4 Jupyter的替代版本

1.4 本书使用的数据集和代码

1.5 小结

第2章 数据改写

2.1 数据科学过程

2.2 使用pandas进行数据加载与预处理

2.2.1 数据快捷加载

2.2.2 处理问题数据

2.2.3 处理大数据集

2.2.4 访问其他的数据格式

2.2.5 数据预处理

2.2.6 数据选择

2.3 使用分类数据和文本数据

2.3.1 特殊的数据类型——文本

2.3.2 使用Beautiful Soup抓取网页

2.4 使用NumPy进行数据处理

2.4.1 NmuPy中的N维数组

2.4.2 NmuPy ndarray对象基础

2.5 创建NumPy数组

2.5.1 从列表到一维数组

2.5.2 控制内存大小

2.5.3 异构列表

2.5.4 从列表到多维数组

2.5.5 改变数组大小

2.5.6 利用NumPy函数生成数组

2.5.7 直接从文件中获得数组

2.5.8 从pandas提取数据

2.6 NumPy快速操作和计算

2.6.1 矩阵运算

2.6.2 NumPy数组切片和索引

2.6.3 NumPy数组堆叠

2.7 小结

第3章 数据科学流程

3.1 EDA简介

3.2 创建新特征

3.3 维数约简

3.3.1 协方差矩阵

3.3.2 主成分分析

3.3.3 一种用于大数据的PCA变型——RandomizedPCA

3.3.4 潜在因素分析

3.3.5 线性判别分析

3.3.6 潜在语义分析

3.3.7 独立成分分析

3.3.8 核主成分分析

3.3.9 T-分布邻域嵌入算法

3.3.10 受限玻尔兹曼机

3.4 异常检测和处理

3.4.1 单变量异常检测

3.4.2 EllipticEnvelope

3.4.3 OneClassSVM

3.5 验证指标

3.5.1 多标号分类

3.5.2 二值分类

3.5.3 回归

3.6 测试和验证

3.7 交叉验证

3.7.1 使用交叉验证迭代器

3.7.2 采样和自举方法

3.8 超参数优化

数据科学导论：Python语言实现（原书第2版）: 数据科学与工程技术丛书豆 0.0分

第1章　新手上路

1.1　数据科学与Python简介

1.2　Python的安装

1.2.1　Python 2还是Python 3

1.2.2　分步安装

1.2.3　工具包的安装

1.2.4　工具包升级

1.2.5　科学计算发行版

1.2.6　虚拟环境

1.2.7　核心工具包一瞥

1.3　Jupyter简介

1.3.1　快速安装与初次使用

1.3.2　Jupyter魔术命令

1.3.3　Jupyter Notebook怎样帮助数据科学家

1.3.4　Jupyter的替代版本

1.4　本书使用的数据集和代码

1.5　小结

第2章　数据改写

2.1　数据科学过程

2.2　使用pandas进行数据加载与预处理

2.2.1　数据快捷加载

2.2.2　处理问题数据

2.2.3　处理大数据集

2.2.4　访问其他的数据格式

2.2.5　数据预处理

2.2.6　数据选择

2.3　使用分类数据和文本数据

2.3.1　特殊的数据类型——文本

2.3.2　使用Beautiful Soup抓取网页

2.4　使用NumPy进行数据处理

2.4.1　NmuPy中的N维数组

2.4.2　NmuPy ndarray对象基础

2.5　创建NumPy数组

2.5.1　从列表到一维数组

2.5.2　控制内存大小

2.5.3　异构列表

2.5.4　从列表到多维数组

2.5.5　改变数组大小

2.5.6　利用NumPy函数生成数组

2.5.7　直接从文件中获得数组

2.5.8　从pandas提取数据

2.6　NumPy快速操作和计算

2.6.1　矩阵运算

2.6.2　NumPy数组切片和索引

2.6.3　NumPy数组堆叠

2.7　小结

第3章　数据科学流程

3.1　EDA简介

3.2　创建新特征

3.3　维数约简

3.3.1　协方差矩阵

3.3.2　主成分分析

3.3.3　一种用于大数据的PCA变型——RandomizedPCA

3.3.4　潜在因素分析

3.3.5　线性判别分析

3.3.6　潜在语义分析

3.3.7　独立成分分析

3.3.8　核主成分分析

3.3.9　T-分布邻域嵌入算法

3.3.10　受限玻尔兹曼机

3.4　异常检测和处理

3.4.1　单变量异常检测

3.4.2　EllipticEnvelope

3.4.3　OneClassSVM

3.5　验证指标

3.5.1　多标号分类

3.5.2　二值分类

3.5.3　回归

3.6　测试和验证

3.7　交叉验证

3.7.1　使用交叉验证迭代器

3.7.2　采样和自举方法

3.8　超参数优化

3.8.1　建立自定义评分函数

3.8.2　减少网格搜索时间

3.9　特征选择

3.9.1　基于方差的特征选择

3.9.2　单变量选择

3.9.3　递归消除