logo
分类于: 计算机基础 互联网 云计算&大数据 人工智能 其它 编程语言

简介

离线和实时大数据开发实战

离线和实时大数据开发实战 7.2分

资源最后更新于 2020-03-29 04:29:42

作者:朱松岭

出版社:出版社机械工业出版社

出版日期:2018-05

ISBN:9787111596783

文件格式: pdf

标签: 大数据 实战 开发

简介· · · · · ·

本书分为三篇。第壹篇:从整体上给出数据大图和数据平台大图,主要介绍数据的主要流程、各个流程的关键技术、数据的主要从业者及他们的职责等;数据平台大图分离线和实时分别给出数据平台架构、关键数据概念和技术等;第二篇:介绍离线数据开发的主要技术,包含Hadoop、Hive、维度建模等,另外此部分还将综合上述各种离线技术给出离线数据处理实战;第三篇:集中介绍实时数据处理的各项技术,包含Storm、SparkSteaming、Flink、Beam等。朱松岭著。

想要: 点击会收藏到你的 我的收藏,可以在这里查看

已收: 表示已经收藏

Tips: 注册一个用户 可以通过用户中心得到电子书更新的通知哦

目录

  1. 前言
  2. 第一篇 数据大图和数据平台大图
  3. 第1章 数据大图
  4. 1.1 数据流程
  5. 1.2 数据技术
  6. 1.3 数据相关从业者和角色
  7. 1.4 本章小结
  8. 第2章 数据平台大图
  9. 2.1 离线数据平台的架构、技术和设计
  10. 2.2 实时数据平台的架构、技术和设计
  11. 2.3 数据管理
  12. 2.4 本章小结
  13. 第二篇 离线数据开发:大数据开发的主战场
  14. 第3章 Hadoop原理实践
  15. 3.1 开启大数据时代的Hadoop
  16. 3.2 HDFS和MapReduce优缺点分析
  17. 3.3 HDFS和MapReduce基本架构
  18. 3.4 MapReduce内部原理实践
  19. 3.5 本章小结
  20. 第4章 Hive原理实践
  21. 4.1 离线大数据处理的主要技术:Hive
  22. 4.2 Hive SQL
  23. 4.3 Hive SQL执行原理图解
  24. 4.4 Hive函数
  25. 4.5 其他SQL on Hadoop技术
  26. 4.6 本章小结
  27. 第5章 Hive优化实践
  28. 5.1 离线数据处理的主要挑战:数据倾斜
  29. 5.2 Hive优化
  30. 5.3 join无关的优化
  31. 5.4 大表join小表优化
  32. 5.5 大表join大表优化
  33. 5.6 本章小结
  34. 第6章 维度建模技术实践
  35. 6.1 大数据建模的主要技术:维度建模
  36. 6.2 维度表设计
  37. 6.3 深入事实表
  38. 6.4 大数据的维度建模实践
  39. 6.5 本章小结
  40. 第7章 Hadoop数据仓库开发实战
  41. 7.1 业务需求
  42. 7.2 Hadoop数据仓库架构设计
  43. 7.3 Hadoop数据仓库规范设计
  44. 7.4 FutureRetailer数据仓库构建实践
  45. 7.5 数据平台新架构——数据湖
  46. 7.6 本章小结
  47. 第三篇 实时数据开发:大数据开发的未来
  48. 第8章 Storm流计算开发
  49. 8.1 流计算技术的鼻祖:Storm技术
  50. 8.2 Storm实时开发示例
  51. 8.3 Storm高级原语Trident
  52. 8.4 Storm关键技术
  53. 8.5 本章小结
  54. 第9章 Spark Streaming流计算开发
  55. 9.1 Spark生态和核心概念
  56. 9.2 Spark生态的流计算技术:Spark Streaming
  57. 9.3 Spark Streaming的实时开发示例
  58. 9.4 Spark Streaming调优实践
  59. 9.5 Spark Streaming关键技术
  60. 9.6 本章小结
  61. 第10章 Flink流计算开发
  62. 10.1 流计算技术新贵:Flink
  63. 10.2 Flink API
  64. 10.3 Flink实时开发示例
  65. 10.4 Flink关键技术详解
  66. 10.5 本章小结
  67. 第11章 Beam技术
  68. 11.1 意图一统流计算的Beam
  69. 11.2 Beam技术核心:Beam Model
  70. 11.3 Beam SDK
  71. 11.4 Beam窗口详解
  72. 11.5 本章小结
  73. 第12章 Stream SQL实时开发实战
  74. 12.1 流计算SQL原理和架构
  75. 12.2 流计算SQL:未来主要的实时开发技术
  76. 12.3 Stream SQL
  77. 12.4 Stream SQL的实时开发实战
  78. 12.5 撤回机制
  79. 12.6 本章小结
  80. 参考文献