logo
分类于: 互联网 编程语言

简介

流式架构:Kafka与MapR Streams数据流处理

流式架构:Kafka与MapR Streams数据流处理 6.8分

资源最后更新于 2020-09-23 15:18:32

作者:【美】Ted Dunning(泰德敦宁)

译者:唐李洋

出版社:电子工业出版社

出版日期:2017-01

ISBN:9787121317224

文件格式: pdf

标签: 流数据 架构 技术 软件开发 大数据 计算科学 程序设计 Kafka

简介· · · · · ·

所有连续的事件流都可以称为数据流。对连续数据流设计和构建流式数据架构,能够实现实时或近实时应用,提升整个组织的效率。《流式架构:Kafka与MapR Streams数据流处理》以Apache Kafka 和MapRStreams为例,重点讲解如何确定使用流数据的时机、如何为多用户系统设计流式架构、为什么要求消息传递层具备某些特定功能,以及为什么需要微服务,并且描述了目前最符合流式设计需求的消息传递和流分析工具,适合架构师、大数据科学家及IT工程师阅读。

直接下载

想要: 点击会收藏到你的 我的收藏,可以在这里查看

已收: 表示已经收藏

Tips: 注册一个用户 可以通过用户中心得到电子书更新的通知哦

目录

第1 章 为什么使用流1
飞机、火车和汽车:车联网和物联网 3
流数据:这才是现实世界 6
什么时候需要流 8
不止是实时:流架构的更多优势11
流架构的最佳实践13
医疗数据流案例 14
流数据:架构设计的核心17
第2 章 流式架构 19
狭义视角:实时应用 20
通用流式架构的关键问题21
消息传递技术的重要性 24
实时分析工具 28
Apache Storm 30
Apache Spark Streaming 31
Apache Flink 32
Apache Apex 33
流分析功能比较33
小结 36
第3 章 流架构:微服务的理想平台 37
为什么需要微服务 38
微服务需要哪些支撑 41
关于微服务的更多详情42
设计流架构:以在线视频服务为例 45
新设计:支持消息传递的基础设施47
通用微架构的重要性 49
命名问题50
为什么使用分布式文件和NoSQL 数据库52
视频服务的新设计 52
小结:综合平台视角 54
第4 章 使用Kafka 进行流传输 57
Kafka 的动机 57
Kafka 的创新 58
Kafka 的基本概念60
排序61
持久化 62
Kafka API 62
KafkaProducer API63
KafkaConsumer API 66
遗留API70
Kafka 实用程序 71
负载均衡 71
镜像 72
Kafka 的陷阱 73
产品环境下的Kafka 73
主题和分区的数目有限 74
手动均衡分区负载 75
没有固有的序列化机制 76
镜像的不足77
小结 78
第5 章 MapR Streams79
MapR Streams 的创新79
MapR 流系统的历史和情境82
MapR Streams 的工作原理 84
配置MapR Streams 86
地理分布式复制 89
MapR Streams 的陷阱 91
第6 章 基于流数据的欺诈检测 93
刷卡速度 94
快速响应决策:“这是欺诈吗”95
多用途流数据98
欺诈检测器的向上扩展 99
小结 101
第7 章 地理分布式数据流 103
利益相关者 104
设计目标 106
设计选择 106
我们的设计 108
数据 108
控制谁能访问流数据109
基于流的地理分布式复制的优势 110
第8 章 总结113
流式架构的优势 115
过渡到流架构116
小结 119
附录A 附加资源121
作者简介125