logo
分类于: 计算机基础 互联网 云计算&大数据 设计

简介

基于Apache Kylin构建大数据分析平台

基于Apache Kylin构建大数据分析平台 7.2分

资源最后更新于 2020-03-29 01:27:16

作者:蒋守壮

出版社:出版社清华大学出版社

出版日期:2017-01

ISBN:9787302454526

文件格式: pdf

标签: 互联网 计算机 限时特价 大数据

简介· · · · · ·

Apache Kylin是一个开源的分布式分析引擎,提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay公司开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。本书分为21章,详细讲解Apache Kylin概念、安装、配置、部署,让读者对Apache Kylin构建大数据分析平台有一个感性认识。同时,本书从应用角度,结合Dome和实例介绍了用于多维分析的Cube算法的创建、配置与优化。最后还介绍了Kyligence公司发布KAP大数据分析平台,对读者有极大的参考价值。本书适合大数据技术初学者、大数据分析人员、大数据架构师等,也适合用于高等院校和培训学校相关专业师生教学参考。

想要: 点击会收藏到你的 我的收藏,可以在这里查看

已收: 表示已经收藏

Tips: 注册一个用户 可以通过用户中心得到电子书更新的通知哦

目录

  1. 内容简介
  2. 推荐序
  3. 前言
  4. 致谢
  5. 第一部分 Apache Kylin基础部分
  6. 第1章 Apache Kylin前世今生
  7. 1.1 Apache Kylin的背景
  8. 1.2 Apache Kylin的应用场景
  9. 1.3 Apache Kylin的发展历程
  10. 第2章 Apache Kylin前奏
  11. 2.1 事实表和维表
  12. 2.2 星型模型和雪花型模型
  13. 2.3 OLAP
  14. 2.4 数据立方体(Data Cube)
  15. 第3章 Apache Kylin工作原理和体系架构
  16. 3.1 Kylin工作原理
  17. 3.2 Kylin体系架构
  18. 3.3 Kylin中的核心部分:Cube构建
  19. 3.4 Kylin的SQL查询
  20. 3.5 Kylin的特性和生态圈
  21. 第4章 搭建CDH大数据平台
  22. 4.1 系统环境和安装包
  23. 4.2 准备工作:系统环境搭建
  24. 4.3 正式安装CDH:准备工作
  25. 4.4 正式安装CDH5:安装配置
  26. 第5章 使用Kylin构建企业大数据分析平台的4种部署方式
  27. 5.1 Kylin部署的架构
  28. 5.2 Kylin的四种典型部署方式
  29. 第6章 单独为Kylin部署HBase集群
  30. 第7章 部署Kylin集群环境
  31. 7.1 部署Kylin的先决条件
  32. 7.2 部署Kylin集群环境
  33. 7.3 为Kylin集群搭建负载均衡器
  34. 第二部分 Apache Kylin进阶部分
  35. 第8章 Demo案例实战
  36. 8.1 Sample Cube案例描述
  37. 8.2 Sample Cube案例实战
  38. 第9章 多维分析的Cube创建实战
  39. 9.1 Cube模型
  40. 9.2 创建Cube的流程
  41. 第10章 Build Cube的来龙去脉
  42. 10.1 流程分析
  43. 10.2 小结
  44. 第三部分 Apache Kylin高级部分
  45. 第11章 Cube优化
  46. 第12章 备份Kylin的Metadata
  47. 12.1 Kylin的元数据
  48. 12.2 备份元数据
  49. 12.3 恢复元数据
  50. 第13章 使用Hive视图
  51. 13.1 使用Hive视图
  52. 13.2 使用视图实战
  53. 第14章 Kylin的垃圾清理
  54. 14.1 清理元数据
  55. 14.2 清理存储器数据
  56. 第15章 JDBC访问方式
  57. 第16章 通过RESTful访问Kylin
  58. 第17章 Kylin版本之间升级
  59. 17.1 从1.5.2升级到最新版本1.5.3
  60. 17.2 从1.5.1升级到1.5.2版本
  61. 17.3 从Kylin 1.5.2.1升级到Kylin 1.5.3实战
  62. 17.4 补充内容
  63. 第18章 大数据可视化实践
  64. 18.1 可视化工具简述
  65. 18.2 安装Kylin ODBC驱动
  66. 18.3 通过Excel访问Kylin
  67. 18.4 通过Power BI访问Kylin
  68. 18.5 通过Tableau访问Kylin
  69. 18.6 Kylin + Mondrian + Saiku
  70. 18.7 实战演练:通过Saiku访问Kylin
  71. 18.8 通过Apache Zepplin访问Kylin
  72. 18.9 通过Kylin的“Insight”查询
  73. 第19章 使用Streaming Table构建准实时Cube
  74. 第20章 快速数据立方算法
  75. 20.1 快速数据立方算法概述
  76. 20.2 快速数据立方算法优点和缺点
  77. 20.3 获取Fast Cubing算法的优势
  78. 第四部分 Apache Kylin的扩展部分
  79. 第21章 大数据智能分析平台KAP
  80. 21.1 大数据智能分析平台KAP概述
  81. 21.2 KAP的安装部署