注重体验与质量的电子书资源下载网站
分类于: 其它
简介
Python数据科学手册 豆 9.3分
资源最后更新于 2020-03-20 17:45:50
作者:https://itpanda.net/book/111/download/109
译者:陶俊杰陈小莉
出版社:出版社人民邮电出版社
出版日期:2018-01
文件格式: pdf
标签: 编程 图灵程序设计丛书 计算机科学 数据分析 机器学习 数据 Python
简介· · · · · ·
本书是对以数据深度需求为中心的科学、研究以及针对计算和统计方法的参考书。本书共五章,每章介绍一到两个Python数据科学中的重点工具包。首先从IPython和Jupyter开始,它们提供了数据科学家需要的计算环境;第2章讲解能提供ndarray对象的NumPy,它可以用Python高效地存储和操作大型数组;第3章主要涉及提供DataFrame对象的Pandas,它可以用Python高效地存储和操作带标签的/列式数据;第4章的主角是Matplotlib,它为Python提供了许多数据可视化功能;第5章以Scikit-Learn为主,这个程序库为最重要的机器学习算法提供了高效整洁的Python版实现。本书适合有编程背景,并打算将开源Python工具用作分析、操作、可视化以及学习数据的数据科学研究人员。Jake VanderPlas:Python科学栈深度用户和开发者,尤其擅长Python科学计算和数据可视化,是altair等可视化程序库的创建人,并为Scikit-Learn、IPython等Python程序库做了大量贡献。现任美国华盛顿大学eScience学院物理科学研究院院长。
目录
版权声明
O'Reilly Media, Inc. 介绍
业界评论
译者序
前言
什么是数据科学
目标读者
为什么用Python
内容概览
使用代码示例
软件安装注意事项
O'Reilly Safari
联系我们
第 1 章 IPython:超越Python
1.1 shell还是Notebook
1.2 IPython的帮助和文档
1.3 IPython shell中的快捷键
1.4 IPython魔法命令
1.5 输入和输出历史
1.6 IPython和shell命令
1.7 与shell相关的魔法命令
1.8 错误和调试
1.9 代码的分析和计时
1.10 IPython参考资料
第 2 章 NumPy入门
2.1 理解Python中的数据类型
2.2 NumPy数组基础
2.3 NumPy数组的计算:通用函数
2.4 聚合:最小值、最大值和其他值
2.5 数组的计算:广播
2.6 比较、掩码和布尔逻辑
2.7 花哨的索引
2.8 数组的排序
2.9 结构化数据:NumPy的结构化数组
第 3 章 Pandas数据处理
3.1 安装并使用Pandas
3.2 Pandas对象简介
3.3 数据取值与选择
3.4 Pandas数值运算方法
3.5 处理缺失值
3.6 层级索引
3.7 合并数据集: Concat 与 Append 操作
3.8 合并数据集:合并与连接
3.9 累计与分组
3.10 数据透视表
3.11 向量化字符串操作
3.12 处理时间序列
3.13 高性能Pandas: eval() 与 query()
3.14 参考资料
第 4 章 Matplotlib数据可视化
4.1 Matplotlib常用技巧
4.2 两种画图接口
4.3 简易线形图
4.4 简易散点图
4.5 可视化异常处理
4.6 密度图与等高线图
4.7 频次直方图、数据区间划分和分布密度
4.8 配置图例
4.9 配置颜色条
4.10 多子图
4.11 文字与注释
4.12 自定义坐标轴刻度
4.13 Matplotlib自定义:配置文件与样式表
4.14 用Matplotlib画三维图
4.15 用Basemap可视化地理数据
4.16 用Seaborn做数据可视化
4.17 参考资料
第 5 章 机器学习
5.1 什么是机器学习
5.2 Scikit-Learn简介
5.3 超参数与模型验证
5.4 特征工程
5.5 专题:朴素贝叶斯分类
5.6 专题:线性回归
5.7 专题:支持向量机
5.8 专题:决策树与随机森林
5.9 专题:主成分分析
5.10 专题:流形学习
5.11 专题:k-means聚类
5.12 专题:高斯混合模型
5.13 专题:核密度估计
5.14 应用:人脸识别管道
5.15 机器学习参考资料
关于作者
关于封面
看完了