logo
分类于: 互联网 编程语言 云计算&大数据

简介

企业数据湖 pdf高清扫描版

企业数据湖 pdf高清扫描版 0.0分

资源最后更新于 2020-03-30 19:20:12

作者:[印度]汤姆斯•约翰

出版社:机械工业出版社

出版日期:2019-1

ISBN:9787111615538

文件格式: pdf

标签: Lambda架构 数据湖

简介· · · · · ·

本书主要分为三部分,第一部分介绍数据湖的概念、数据湖在企业中的重要性以及Lambda架构。第二部分深入研究使用Lambda架构构建数据湖所需的主要技术组件,介绍流行的大数据技术,如Apache Hadoop、Sqoop、Flume、Flink和Elasticsearch等。第三部分展示一些非常实用的数据湖落地建议,包括企业应如何建立一个真实的数据湖,以及提高数据湖运营效率所需的其他技术组件。第三部分最后还详细介绍了几个实际的用例,以及在企业内实现这些用例时应考虑的重要方面。通过阅读本书,你将:•使用大数据技术构建企业级数据湖。•掌握Lambda架构的精髓,以及如何在企业内使用它。•学习与Apache Sqoop及其功能相关的技术细节。•Kafka与Hadoop组件集成,用于获取企业数据。•使用Flume进行流式数据处理。•理解Flink与流式数据处理的关系。•Hadoop生态圈组件的协同使用,以及它们能带来的好处。•使用Elastic Stack构建快速、流式、高吞吐应用。•确保数据摄取处理在不同数据格式配置时的一致性。

想要: 点击会收藏到你的 我的收藏,可以在这里查看

已收: 表示已经收藏

Tips: 注册一个用户 可以通过用户中心得到电子书更新的通知哦