我爱电子书-《Apache Kylin权威指南: 大数据技术丛书》| pdf + epub + mobi + awz3, 高清版, 带目录，Kindle版, 多看精排版下载

注重体验与质量的电子书资源下载网站

分类于: 计算机基础互联网云计算&大数据

简介

Apache Kylin权威指南: 大数据技术丛书豆 0.0分

资源最后更新于 2020-03-29 04:21:21

作者：Apache Kylin核心团队

出版社：出版社机械工业出版社

出版日期：2017-01

文件格式： pdf

标签：互联网网络计算机服务器大数据技术丛书

简介· · · · · ·

在数据分析领域，大部分的技术都诞生在国外，特别是美国，从最初的数据库，到以Hadoop为首的大数据技术，再到今天各种DL（Deep Learning）、AI，等等。但我国拥有着世界上独一无二的“大”数据，最多的人口、最多的移动设备、最活跃的应用市场、最复杂的网络环境等，应对这些挑战，我们需要有自己的核心技术，特别是在基础领域的突破和研发方面。今天，以Apache Kylin为首的各种来自中国的先进技术不断涌现，甚至在很多方面都大大超越了国外的其他技术，这一点也彰显了中国的技术实力。作者：Apache Kylin核心团队。

直接下载

简介

Apache Kylin权威指南: 大数据技术丛书 豆 0.0分

简介· · · · · ·

目录

推荐序一

推荐序二

推荐序三

推荐序四

前言

第1章 Apache Kylin概述

1.1 背景和历史

1.2 Apache Kylin的使命

1.2.1 为什么要使用Apache Kylin

1.2.2 Apache Kylin怎样解决关键问题

1.3 Apache Kylin的工作原理

1.3.1 维度和度量简介

1.3.2 Cube和Cuboid

1.3.3 工作原理

1.4 Apache Kylin的技术架构

1.5 Apache Kylin的主要特点

1.5.1 标准SQL接口

1.5.2 支持超大数据集

1.5.3 亚秒级响应

1.5.4 可伸缩性和高吞吐率

1.5.5 BI及可视化工具集成

1.6 与其他开源产品比较

1.7 小结

第2章 快速入门

2.1 核心概念

2.1.1 数据仓库、OLAP与BI

2.1.2 维度和度量

2.1.3 事实表和维度表

2.1.4 Cube、Cuboid和Cube Segment

2.2 在Hive中准备数据

2.2.1 星形模型

2.2.2 维度表的设计

2.2.3 Hive表分区

2.2.4 了解维度的基数

2.2.5 Sample Data

2.3 设计Cube

2.3.1 导入Hive表定义

2.3.2 创建数据模型

2.3.3 创建Cube

2.4 构建Cube

2.4.1 全量构建和增量构建

2.4.2 历史数据刷新

2.4.3 合并

2.5 查询Cube

2.6 SQL参考

2.7 小结

第3章 增量构建

3.1 为什么要增量构建

3.2 设计增量Cube

3.2.1 设计增量Cube的前提

3.2.2 增量Cube的创建

3.3 触发增量构建

3.3.1 Web GUI触发

3.3.2 构建相关的Rest API

3.4 管理Cube碎片

3.4.1 合并Segment

3.4.2 自动合并

3.4.3 保留Segment

3.4.4 数据持续更新

3.5 小结

第4章 流式构建

4.1 为什么要流式构建

4.2 准备流式数据

4.2.1 数据格式

4.2.2 消息队列

4.2.3 创建Schema

4.3 设计流式Cube

4.3.1 创建Model

4.3.2 创建Cube

4.4 流式构建原理

4.5 触发流式构建

4.5.1 单次触发

4.5.2 自动化多次触发

4.5.3 出错处理

4.6 小结

第5章 查询和可视化

Apache Kylin权威指南: 大数据技术丛书豆 0.0分

第1章　Apache Kylin概述

1.1　背景和历史

1.2　Apache Kylin的使命

1.2.1　为什么要使用Apache Kylin

1.2.2　Apache Kylin怎样解决关键问题

1.3　Apache Kylin的工作原理

1.3.1　维度和度量简介

1.3.2　Cube和Cuboid

1.3.3　工作原理

1.4　Apache Kylin的技术架构

1.5　Apache Kylin的主要特点

1.5.1　标准SQL接口

1.5.2　支持超大数据集

1.5.3　亚秒级响应

1.5.4　可伸缩性和高吞吐率

1.5.5　BI及可视化工具集成

1.6　与其他开源产品比较

1.7　小结

第2章　快速入门

2.1　核心概念

2.1.1　数据仓库、OLAP与BI

2.1.2　维度和度量

2.1.3　事实表和维度表

2.1.4　Cube、Cuboid和Cube Segment

2.2　在Hive中准备数据

2.2.1　星形模型

2.2.2　维度表的设计

2.2.3　Hive表分区

2.2.4　了解维度的基数

2.2.5　Sample Data

2.3　设计Cube

2.3.1　导入Hive表定义

2.3.2　创建数据模型

2.3.3　创建Cube

2.4　构建Cube

2.4.1　全量构建和增量构建

2.4.2　历史数据刷新

2.4.3　合并

2.5　查询Cube

2.6　SQL参考

2.7　小结

第3章　增量构建

3.1　为什么要增量构建

3.2　设计增量Cube

3.2.1　设计增量Cube的前提

3.2.2　增量Cube的创建

3.3　触发增量构建

3.3.1　Web GUI触发

3.3.2　构建相关的Rest API

3.4　管理Cube碎片

3.4.1　合并Segment

3.4.2　自动合并

3.4.3　保留Segment

3.4.4　数据持续更新

3.5　小结

第4章　流式构建

4.1　为什么要流式构建

4.2　准备流式数据

4.2.1　数据格式

4.2.2　消息队列

4.2.3　创建Schema

4.3　设计流式Cube

4.3.1　创建Model

4.3.2　创建Cube

4.4　流式构建原理

4.5　触发流式构建

4.5.1　单次触发

4.5.2　自动化多次触发

4.5.3　出错处理

4.6　小结

第5章　查询和可视化

5.1　Web GUI

5.1.1　查询

5.1.2　显示结果

5.2　Rest API

5.2.1　查询认证

5.2.2　查询请求参数

5.2.3　查询返回结果

5.3　ODBC