注重体验与质量的电子书资源下载网站
分类于: 计算机基础 云计算&大数据 职场办公
简介
Hadoop大数据挖掘从入门到进阶实战: 视频教学版 豆 0.0分
资源最后更新于 2020-03-29 04:48:06
作者:邓杰 编著
出版社:出版社机械工业出版社
出版日期:2018-06
ISBN:9787111600107
文件格式: pdf
标签: 计算机 大数据 数据 Hadoop 实战案例 教学教材
简介· · · · · ·
本书采用“理论+实战”的形式编写,全面介绍了Hadoop大数据挖掘的相关知识。本书共分为13章,涵盖的主要内容有:集群及开发环境搭建;快速构建一个Hadoop项目并线上运行;Hadoop套件实战;Hive编程,使用SQL提交MapReduce任务到Hadoop集群;游戏玩家的用户行为分析,特征提取;Hadoop平台管理与维护;Hadoop异常处理解决方案;初识Hadoop核心源码;Hadoop通信机制和内部协议;Hadoop分布式文件系统剖析;ELK实战案例——游戏应用实时日志分析平台;Kafka实战案例,实时处理游戏用户数据;Hadoop拓展,Kafka剖析。本书不但适合刚入门的初学者系统学习Hadoop的各种基础语法和开发技巧,而且也适合有多年开发经验的开发者进阶提高。另外,本书也适合社会培训机构和相关院校作为教材或者教学参考书。邓杰编著。
目录
前言
第1章 集群及开发环境搭建
1.1 环境准备
1.2 安装Hadoop
1.3 Hadoop版Hello World
1.4 开发环境
1.5 小结
第2章 实战:快速构建一个Hadoop项目并线上运行
2.1 构建一个简单的项目工程
2.2 操作分布式文件系统(HDFS)
2.3 利用IDE提交MapReduce作业
2.4 编译应用程序并打包
2.5 部署与调度
2.6 小结
第3章 Hadoop套件实战
3.1 Sqoop——数据传输工具
3.2 Flume——日志收集工具
3.3 HBase——分布式数据库
3.4 Zeppelin——数据集分析工具
3.5 Drill——低延时SQL查询引擎
3.6 Spark——实时流数据计算
3.7 小结
第4章 Hive编程——使用SQL提交MapReduce任务到Hadoop集群
4.1 环境准备与Hive初识
4.2 安装与配置Hive
4.3 可编程方式
4.4 运维和监控
4.5 小结
第5章 游戏玩家的用户行为分析——特征提取
5.1 项目应用概述
5.2 分析与设计
5.3 技术选型
5.4 编码实践
5.5 小结
第6章 Hadoop平台管理与维护
6.1 Hadoop分布式文件系统(HDFS)
6.2 Hadoop平台监控
6.3 平台维护
6.4 小结
第7章 Hadoop异常处理解决方案
7.1 定位异常
7.2 解决问题的方式
7.3 实战案例分析
7.4 小结
第8章 初识Hadoop核心源码
8.1 基础准备与源码编译
8.2 初识Hadoop 2
8.3 MapReduce框架剖析
8.4 序列化
8.5 小结
第9章 Hadoop通信机制和内部协议
9.1 Hadoop RPC概述
9.2 Hadoop RPC的分析与使用
9.3 通信协议
9.4 小结
第10章 Hadoop分布式文件系统剖析
10.1 HDFS介绍
10.2 HDFS架构剖析
10.3 数据迁移实战
10.4 小结
第11章 ELK实战案例——游戏应用实时日志分析平台
11.1 Logstash——实时日志采集、分析和传输
11.2 Elasticsearch——分布式存储及搜索引擎
11.3 Kibana——可视化管理系统
11.4 实时日志分析平台案例
11.5 小结
第12章 Kafka实战案例——实时处理游戏用户数据
12.1 应用概述
12.2 项目的分析与设计
12.3 项目的编码实践
12.4 小结
第13章 Hadoop拓展——Kafka剖析
13.1 Kafka开发与维护
13.2 运维监控
13.3 Kafka源码分析
13.4 小结