注重体验与质量的电子书资源下载网站
分类于: 编程语言 计算机基础 云计算&大数据 职场办公
简介
Flink原理、实战与性能优化: 大数据技术丛书 豆 6.9分
资源最后更新于 2020-03-29 05:03:29
作者:张利兵
出版社:出版社机械工业出版社
出版日期:2019-04
ISBN:9787111623533
文件格式: pdf
简介· · · · · ·
这是一部以实战为导向,能指导读者零基础掌握Flink并快速完成进阶的著作,从功能、原理、实战和调优等4个维度循序渐进地讲解了如何利用Flink进行分布式流式应用开发。作者是该领域的资深专家,现就职于第四范式,曾就职于明略数据。全书一共10章,逻辑上可以分为三个部分:第一部分(第1~2章)主要介绍了Flink的核心概念、特性、应用场景、基本架构,开发环境的搭建和配置,以及源代码的编译。第二部分(第3~9章)详细讲解了Flink的编程范式,各种编程接口的功能、应用场景和使用方法,以及核心模块和组件的原理和使用。第三部分(第10章)重点讲解了Flink的监控和优化,参数调优,以及对反压、Checkpoint和内存的优化。张利兵,资深架构师,流式计算领域专家,第四范式华东区AI项目架构师,原明略数据华东区大数据架构师。有多年大数据、流式计算方面的开发经验,对Hadoop、Spark、Flink等大数据计算引擎有着非常深入的理解,积累了丰富的项目实践经验。先后利用相关技术为银行、证券、地铁等领域的头部企业构建了内部大数据平台,参与了基于Flink的实时反欺诈风控、实时地铁故障预警等流式计算平台的设计和研发。
目录
前言
第1章 Apache Flink介绍
1.1 Apache Flink是什么
1.2 数据架构的演变
1.3 Flink应用场景
1.4 Flink基本架构
1.5 本章小结
第2章 环境准备
2.1 运行环境介绍
2.2 Flink项目模板
2.3 Flink开发环境配置
2.4 运行Scala REPL
2.5 Flink源码编译
2.6 本章小结
第3章 Flink编程模型
3.1 数据集类型
3.2 Flink编程接口
3.3 Flink程序结构
3.4 Flink数据类型
3.5 本章小结
第4章 DataStream API介绍与使用
4.1 DataStream编程模型
4.2 时间概念与Watermark
4.3 Windows窗口计算
4.4 作业链和资源组
4.5 Asynchronous I/O异步操作
4.6 本章小结
第5章 Flink状态管理和容错
5.1 有状态计算
5.2 Checkpoints和Savepoints
5.3 状态管理器
5.4 Querable State
5.5 本章小结
第6章 DataSet API介绍与使用
6.1 DataSet API
6.2 迭代计算
6.3 广播变量与分布式缓存
6.4 语义注解
6.5 本章小结
第7章 Table API & SQL介绍与使用
7.1 TableEnviroment概念
7.2 Flink Table API
7.3 Flink SQL使用
7.4 自定义函数
7.5 自定义数据源
7.6 本章小结
第8章 Flink组件栈介绍与使用
8.1 Flink复杂事件处理
8.2 Flink Gelly图计算应用
8.3 FlinkML机器学习应用
8.4 本章小结
第9章 Flink部署与应用
9.1 Flink集群部署
9.2 Flink高可用配置
9.3 Flink安全管理
9.4 Flink集群升级
9.5 本章小结
第10章 Flink监控与性能优化
10.1 监控指标
10.2 Backpressure监控与优化
10.3 Checkpointing监控与优化
10.4 Flink内存优化
10.5 本章小结