logo
分类于: 编程语言 计算机基础 云计算&大数据 人工智能

简介

Greenplum企业应用实战

Greenplum企业应用实战 8.3分

资源最后更新于 2020-09-03 19:29:51

作者:何勇

出版社:出版社机械工业出版社

出版日期:2014-10

ISBN:9787111481003

文件格式: pdf

标签: 数据挖掘 数据分析 大数据 数据库

简介· · · · · ·

这是国内首本Greenplum著作,国内最早开始使用Greenplum的企业是阿里巴巴,本书的两位作者是阿里巴巴最早负责使用和维护Greenplum的技术工程师,权威性毋庸置疑。本书完全立足于阿里巴巴的企业应用实践,不仅系统介绍Greenplum的功能特性、使用方法、高级应用,而且还详细讲解Greenplum的系统架构、运维管理、性能优化和各种技巧。最重要的是,包含大量企业级应用案例,每个案例都进行了详尽的讲解和实操指导。全书一共15章,分为三个部分:基础篇(第1~3章)首先介绍了Greenplum的应用场景、功能特性以及与PostgreSQL的关系,然后讲解了Greenplum的安装配置、语法以及相关操作,最后通过两个具体的数据仓库ETL案例加强读者对Greenplum的功能特性的了解和操作能力;进阶篇(第4~7章)围绕数据字典、执行计划、系统架构、高级特性等主题对Greenplum进行了更深入地讲解,不仅能让读者更深入理解Greenplum的工作原理,也能让读者游刃有余地应对各种日常操作;管理篇(8~15章)从运维和管理的角度讲解了Greenplum的线上部署、数据库管理、脚本维护、监控、权限控制、容灾/扩容、备份恢复、性能调优、常用技巧和常见问题等。陈晓峰陈晓峰 资深数据库专家和高级开发工程师,对Greenplum和PostgreSQL等数据库以及Hadoop和Storm等大数据技术有非常深入的研究和丰富的实践经验。曾就职于阿里巴巴数据平台部和数据平台事业部,负责数据仓库Greenplum计算集群、报表集群的维护及调优,担任RTDC项目和天罡项目的技术负责人,以及负责双十一的交易直播间项目;现就职于阿里巴巴小微金服集团保险事业部,负责保险事业部所有险种的核保核赔。熟悉Java、C、C++、Python,以及数据挖掘和数据分析相关技术。何勇何勇 资深数据库专家和软件架构师,对Greenplum、Oracle、Teradata、MySQL以及各种NoSQL都有非常深入的研究,实战经验丰富。曾就职于阿里巴巴和盛大,从事数据库系统架构、软件架构和数据中心相关的工作。熟悉Perl、Python、Java、C,以及移动开发。杭州遥指科技有限公司联合创始人兼CTO。

想要: 点击会收藏到你的 我的收藏,可以在这里查看

已收: 表示已经收藏

Tips: 注册一个用户 可以通过用户中心得到电子书更新的通知哦

目录

  1. 前言
  2. 为什么写作本书
  3. 本书组织结构
  4. 本书面向的读者
  5. 如何阅读本书
  6. 勘误和支持
  7. 致谢
  8. 上篇 基础篇
  9. 第1章 Greenplum简介
  10. 1.1 Greenplum的起源和发展历程
  11. 1.2 OLTP与OLAP
  12. 1.3 PostgreSQL与Greenplum的关系
  13. 1.4 Greenplum特性及应用场景
  14. 1.5 小结
  15. 第2章 Greenplum快速入门
  16. 2.1 软件安装及数据库初始化
  17. 2.2 安装Greenplum的常见问题
  18. 2.3 畅游Greenplum
  19. 2.4 小结
  20. 第3章 Greenplum实战
  21. 3.1 历史拉链表
  22. 3.2 日志分析
  23. 3.3 数据分布
  24. 3.4 数据压缩
  25. 3.5 索引
  26. 3.6 小结
  27. 中篇 进阶篇
  28. 第4章 数据字典详解
  29. 4.1 oid无处不在
  30. 4.2 数据库集群信息
  31. 4.3 常用数据字典
  32. 4.4 分区表信息
  33. 4.5 自定义类型以及类型转换
  34. 4.6 主、备节点同步的相关数据字典
  35. 4.7 数据字典应用示例
  36. 4.8 Gp_toolkit介绍
  37. 4.9 小结
  38. 第5章 执行计划详解
  39. 5.1 执行计划入门
  40. 5.2 分布式执行计划概述
  41. 5.3 Greenplum执行计划中的术语
  42. 5.4 数据库统计信息收集
  43. 5.5 控制执行计划的参数介绍
  44. 5.6 规划器开销的计算方法
  45. 5.7 各种执行计划原理分析
  46. 5.8 案例
  47. 5.9 小结
  48. 第6章 Greenplum高级应用
  49. 6.1 Appendonly表与压缩表
  50. 6.2 列存储
  51. 6.3 外部表高级应用
  52. 6.4 自定义函数——各个编程接口
  53. 6.5 Greenplum MapReduce
  54. 6.6 小结
  55. 第7章 Greenplum架构介绍
  56. 7.1 并行和分布式计算
  57. 7.2 并行数据库
  58. 7.3 Greenplum架构分析
  59. 7.4 冗余与故障切换
  60. 7.5 数据分布及负载均衡
  61. 7.6 跨库关联
  62. 7.7 分布式事务
  63. 7.8 其他大数据分析方案
  64. 7.9 小结
  65. 下篇 管理篇
  66. 第8章 Greenplum线上环境部署
  67. 8.1 服务器硬件选型
  68. 8.2 服务器系统参数调整
  69. 8.3 计算节点分配技巧
  70. 8.4 数据库参数介绍
  71. 8.5 数据库集群基准测试
  72. 8.6 小结
  73. 第9章 数据库管理
  74. 9.1 用户及权限管理
  75. 9.2 登录权限控制
  76. 9.3 资源队列及并发控制
  77. 9.4 Greenplum锁机制
  78. 9.5 数据目录结构
  79. 9.6 数据文件存储分布
  80. 9.7 表空间管理
  81. 9.8 小结
  82. 第10章 数据库监控及调优
  83. 10.1 Linux监控工具介绍
  84. 10.2 安装Performance Monitor
  85. 10.3 监控Segment是否正常
  86. 10.4 VACUUM系统表
  87. 10.5 数据倾斜排查
  88. 10.6 查看子节点的SQL运行状态
  89. 10.7 自动加分区
  90. 10.8 自动赋权
  91. 10.9 清理过期数据
  92. 10.10 小结
  93. 第11章 解读Greenplum维护脚本
  94. 11.1 添加Greenplum Contrib模块
  95. 11.2 启动和关闭脚本gpstart和gpstop
  96. 11.3 初始化系统脚本gpinitsystem
  97. 11.4 集群操作脚本gpssh和gpscp
  98. 11.5 数据库状态检查脚本gpstate
  99. 11.6 数据库升级脚本gpmigrate
  100. 11.7 参数修改脚本gpconfig
  101. 11.8 数据库一致性检查脚本gpcheckcat
  102. 11.9 小结
  103. 第12章 备份及恢复策略
  104. 12.1 Greenplum 3.x
  105. 12.2 Greenplum 4.x
  106. 12.3 gp_dump和pg_dump
  107. 12.4 Greenplum Master备份策略
  108. 12.5 小结
  109. 第13章 数据库扩容
  110. 13.1 迁移计算节点
  111. 13.2 增加计算节点
  112. 13.3 小结
  113. 第14章 基于Greenplum的海量数据实时分析服务平台
  114. 14.1 需求概述
  115. 14.2 典型方案
  116. 14.3 基于Greenplum的混合架构
  117. 14.4 小结
  118. 第15章 使用Greenplum的常见报错及小技巧
  119. 15.1 分析常见报错
  120. 15.2 常见问题及解决办法
  121. 15.3 常用的一些小技巧
  122. 15.4 小结