logo
分类于: 其它 职场办公

简介

ggplot2:数据分析与图形艺术(第2版)

ggplot2:数据分析与图形艺术(第2版) 0.0分

资源最后更新于 2020-08-23 16:19:45

作者:[美]哈德利•威克姆

译者:黄俊文

出版社:西安交通大学出版社

出版日期:2018-01

ISBN:9787569306385

文件格式: pdf

标签: 数据分析 ggplot2 R visualization learning R语言 计算机 数据可视化

简介· · · · · ·

与本书第1版相比,ggplot2发生了诸多改造和升级,与之相应地,Hadley Wickham对本书也进行了更新换代。ggplot2是R的一个数据可视化包,它能帮助用户轻松地绘制各类图像,包括多图层复合图像。ggplot2可以帮助你:

 使用不同数据源叠加多个图层(点、线、地图、瓦片图、箱线图等),且图层间具有自动调节的统一尺度。

 添加指定平滑器,通过R卓越的建模性能,拟合线性模型、稳健回归、局部加权模型、广义可加模型等。

 存储各类ggplot2图像(或其中一部分),以便进一步调整处理。

 创建自定义图像主题,满足各类机构或期刊对图片的要求,以轻松地应用到多个图像中。

 从视觉角度处理图像,有助于探索如何更好地展现数据的各个部分。

对于每一个纠结于如何有效生动地展示数据的人,这本书是一盏指路明灯。当然,为了学习本书,R的基本知识仍是必要...

想要: 点击会收藏到你的 我的收藏,可以在这里查看

已收: 表示已经收藏

Tips: 注册一个用户 可以通过用户中心得到电子书更新的通知哦

目录

第 2 版中译本序
ggplot2 的发展
近五年来,数据科学变得举足轻重,其中数据可视化的流程不可或缺。数据可视化为人类提供了对数据的直观理解与感受。各类软件中,R 由于它和统计学的渊源、开源、易用性而受到数据科学家的青睐,ggplot2 包更是数据可视化中必不可少的神兵利器。
在软件更新换代极快的时代,ggplot2 用它长久的生命力、庞大的使用量证实了其设计之优良。现在,ggplot2 在RStudio CRAN 镜像的每月下载量达到了惊人的45 万!下图展示了下载量的变化;当然,是用ggplot2 绘制的。
本书的变化
本书英文第1 版出版于2009 年,第2 版面世于2016 年。因为英文第2 版相对于第1 版有了重大变化,所以中文版也需要大量的相应修订。例如,工具箱和标度两章有大幅更新内容,数据分析则拆分成全新的3 章。读者查阅这些章节的时候,实际上同步享受着这几年内软件工具的变动和数据分析思维的进步。
此外,翻译第1 版的时候,由于0.9.* 的版本API 变动频繁,译者作了大量修正。而现在ggplot2 已经到了稳定的2.2.* 版,API 经过“千锤百炼”,已经趋于稳定。因此,读者阅读本书的时候,基本不必担心代码的兼容问题。而且,最新版的ggplot2 包含了扩展机制,开发者可以按需自行定义自己的主题、风格、内容。无论你想绘制什么二维静态统计图形,ggplot2 都值得一试。
还有,现在的英文版和中文版书籍源码均大量采用了knitr 包的技术,大量图形都是根据所标记的代码直接绘制出来。这种方式大量减少了图形排版错误、代码不兼容等情况,给作者、译者带来了很大的便利;可以想象,对读者阅读、学习书中代码也大有裨益。
最后,中文版里,为了优化排版效果,对部分代码块的换行和空行作了微调(其余内容不变);正文的图片也改为黑白,必须用彩色的绘图则放到正文后的彩图附录中。
致谢
首先要感谢Hadley Wickham 的卓越创新,ggplot2 软件包和本书英文原版均主要出于他手。
我们感谢第2 版的译者:黄俊文(第1、7、8、11、12 章)、王小宁(第4、5、6 章)、于嘉傲(第2、3 章)、冯璟烁(第9、10 章)。黄俊文和王小宁负责R markdown 和LATEX 排版,王小宁负责和出版社的对接。此外,魏太云提供了不少意见。我们因为统计之都社区(https://cosx.org)而走在了一起。
感谢西安交通大学出版社,他们为中文R 社区作出了重要的贡献。
正所谓“站在巨人的肩膀上”,第2 版的翻译绝对离不开第1 版所有译者和审校者所打下的基础。我们感谢第1 版的译者:邱怡轩、主伟呈、肖楠、高涛、潘岚锋、魏太云,他们均来自于统计之都社区;以及担任第1 版审校的殷腾飞;还有所有为第1 版翻译提供了不可或缺的帮助的老师与朋友:孟生旺、张政、肖凯、余光创、陈妍、李晓矛、谢漫锜、李皞、韩帅、陈丽云、李舰、刘思喆、邓一硕、陈堰平、谢益辉等。
黄俊文
2018 年10 月
前言
欢迎来到第2 版《ggplot2:数据分析与图形艺术》。我很高兴这本书能得以改版,从而展示ggplot2 包中最新、最棒的特点,以及近5 年来在R 社区和ggplot2 社区发生的巨大变化。ggplot2 社区是一个充满活力的社区,其邮件列表中有着超过7000 名成员,并且还拥有一个十分活跃的Stack Overflow 社区,每天被打上ggplot2 标签的问题就有近万个。鉴于目前我已经基本不再对ggplot2进行更改,现在来学习使用这个包是再合适不过了。
ggplot2 是成功的,它是R 中下载量最大的包之一(仅去年一年就被下载了超过一百万次!),并且影响了其他语言中绘图包的设计。我也由衷感激它的成功,ggplot2 包给了我很多周游世界的机会,让我遇到很多有趣的人。我喜欢听人们谈论他们如何利用R 和ggplot2 来理解他们所关心的数据。
十分感谢Carson Sievert 先生对改版工作的支持,他帮助我修正了大量代码,包括将源码转换为R Markdown 文档的工作。另外,他还更新了书中的诸多例子并审校了全文。
主要变化
为了保证此次改版是对本书第1 版的充分升级,我做了许多工作,除随处可
见的代码更新(以保证与最新版本的ggplot2 兼容)之外,还包括:
• 在书中增加了大量代码,使本书更易于作为参考书使用。全书对knitr 更加友好:减少了独立图表并增加了内联代码。这样的布局可能确实不如原书靓丽,但可以让相关的内容更加紧凑。
• 本书完整的源代码发布在https://github.com/hadley/ggplot2-book。
• 简介中,把qplot() 改成ggplot() 入门。先前有反馈意见指出,qplot 像是根拐杖:它虽然使得作简单的图变得容易了一些,但却不能帮助用户掌握语法。
• 增加了练习的部分,读者可以在学习新的技巧后立刻进行实践。
• 为那些围绕ggplot2 包建立的大量的包增加了指引,这些包构成了一个丰富的生态系统。你将在书中看到大量的其他包被高亮标出并且有对应的指引。这些包在我看来都十分有用。
• 第3 章工具箱一章,包含所有新的几何对象。增加了全新的3.3 文本标签一节,标签十分重要,但在上一版中并没有详细的介绍。3.7 节绘制地图一节中,扩展了地图数据的类型,并给出了获取这些数据的方式。
• 重写了第6 章标度一章,使之更专注于最重要的任务。这章还讨论了一些新的功能,它们能对图例外观进行更精确的控制,并在6.6 节展示了ggplot2 中新增的标度细节。
• 原书中数据分析一章被分为三个部分:数据整理(基于tidyr 包),数据操作(基于dplyr包),和模型可视化(基于broom 包)。我将介绍我自己开发的最新版的数据操作工具,和David Robinson 开发的非常棒的broom 包。
第1章 简介
第2章 ggplot2入门
第3章 工具箱
第4章语法突破
第5章 用图层构建图像
第6章 标度、坐标轴和图例
第7章 定位
第8章 主题
第9章 数据整理
第10章 数据变换
第11章 为可视化建模
第12章 用ggplot2编程
附录 主题索引,R代码索引,彩色插图