logo
分类于: 编程语言 计算机基础 云计算&大数据

简介

从零开始学Hadoop大数据分析(视频教学版): 凝聚资深专家12年一线开发经验,手把手带你掌握Hadoop核心技术

从零开始学Hadoop大数据分析(视频教学版): 凝聚资深专家12年一线开发经验,手把手带你掌握Hadoop核心技术 0.0分

资源最后更新于 2020-03-29 03:52:25

作者:温春水毕洁馨

出版社:出版社机械工业出版社

出版日期:2019-03

ISBN:9787111619314

文件格式: pdf

标签: 计算机 软件开发 程序设计 大数据 Java

简介· · · · · ·

本书全面介绍了Hadoop大数据分析的基础知识、14个核心组件模块及4个项目实战案例。为了帮助读者高效、直观地学习,作者特意为本书录制了20小时同步配套教学视频。本书共19章,分为3篇。第1篇Hadoop基础知识,涵盖大数据概述、Hadoop的安装与配置、Hadoop分布式文件系统及基于Hadoop3的HDFS高可用等相关内容;第2篇Hadoop核心技术,涵盖的内容有Hadoop的分布式协调服务——ZooKeeper;分布式离线计算框架——MapReduce;Hadoop的集群资源管理系统——YARN;Hadoop的数据仓库框架——Hive;大数据快速读写——HBase;海量日志采集工具——Flume;Hadoop和关系型数据库间的数据传输工具——Sqoop;分布式消息队列——Kafka;开源内存数据库——Redis;Ambari和CDH;快速且通用的集群计算系统——Spark。第3篇Hadoop项目案例实战,主要介绍了基于电商产品的大数据业务分析系统、用户画像分析、基于个性化的视频推荐系统及电信离网用户挽留4个项目实战案例,以提高读者的大数据项目开发水平。本书内容全面,实用性强,适合作为Hadoop大数据分析与挖掘的入门读物,也可作为Java程序员的进阶读物。另外,本书还特别适合想要提高大数据项目开发水平的人员阅读。对于专业的培训机构和相关院校而言,本书也是一本不可多得的教学用书。温春水,毕洁馨编著
直接下载

想要: 点击会收藏到你的 我的收藏,可以在这里查看

已收: 表示已经收藏

Tips: 注册一个用户 可以通过用户中心得到电子书更新的通知哦

目录

  1. 前言
  2. 第1篇 Hadoop基础知识
  3. 第1章 初识Hadoop
  4. 1.1 大数据初探
  5. 1.2 Hadoop简介
  6. 1.3 小结
  7. 第2章 Hadoop的安装与配置
  8. 2.1 虚拟机的创建
  9. 2.2 安装Linux系统
  10. 2.3 配置网络信息
  11. 2.4 克隆服务器
  12. 2.5 SSH免密码登录
  13. 2.6 安装和配置JDK
  14. 2.7 Hadoop环境变量配置
  15. 2.8 Hadoop分布式安装
  16. 2.9 小结
  17. 第3章 Hadoop分布式文件系统
  18. 3.1 DFS介绍
  19. 3.2 HDFS介绍
  20. 3.3 Hadoop中HDFS的常用命令
  21. 3.4 HDFS的应用
  22. 3.5 小结
  23. 第4章 基于Hadoop 3的HDFS高可用
  24. 4.1 Hadoop 3.x的发展
  25. 4.2 Hadoop 3 HDFS完全分布式搭建
  26. 4.3 什么是HDFS高可用
  27. 4.4 搭建HDFS高可用
  28. 4.5 小结
  29. 第2篇 Hadoop核心技术
  30. 第5章 Hadoop的分布式协调服务——ZooKeeper
  31. 5.1 ZooKeeper的核心概念
  32. 5.2 ZooKeeper的安装与运行
  33. 5.3 ZooKeeper服务器端的常用命令
  34. 5.4 客户端连接ZooKeeper的相关操作
  35. 5.5 使用Java API访问ZooKeeper
  36. 5.6 小结
  37. 第6章 分布式离线计算框架——MapReduce
  38. 6.1 MapReduce概述
  39. 6.2 MapReduce执行过程
  40. 6.3 MapReduce实例
  41. 6.4 温度排序实例
  42. 6.5 小结
  43. 第7章 Hadoop的集群资源管理系统——YARN
  44. 7.1 为什么要使用YARN
  45. 7.2 YARN的基本架构
  46. 7.3 YARN工作流程
  47. 7.4 YARN搭建
  48. 7.5 小结
  49. 第8章 Hadoop的数据仓库框架——Hive
  50. 8.1 Hive的理论基础
  51. 8.2 Hive的配置与安装
  52. 8.3 Hive表的操作
  53. 8.4 表的分区与分桶
  54. 8.5 内部表与外部表
  55. 8.6 内置函数与自定义函数
  56. 8.7 通过Java访问Hive
  57. 8.8 Hive优化
  58. 8.9 小结
  59. 第9章 大数据快速读写——HBase
  60. 9.1 关于NoSQL
  61. 9.2 HBase基础
  62. 9.3 HBase安装
  63. 9.4 HBase的Shell操作
  64. 9.5 Java API访问HBase实例
  65. 9.6 小结
  66. 第10章 海量日志采集工具——Flume
  67. 10.1 什么是Flume
  68. 10.2 Flume的特点
  69. 10.3 Flume架构
  70. 10.4 Flume的主要组件
  71. 10.5 Flume安装
  72. 10.6 Flume应用典型实例
  73. 10.7 通过exec命令实现数据收集
  74. 10.8 小结
  75. 第11章 Hadoop和关系型数据库间的数据传输工具——Sqoop
  76. 11.1 什么是Sqoop
  77. 11.2 Sqoop工作机制
  78. 11.3 Sqoop的安装与配置
  79. 11.4 Sqoop数据导入实例
  80. 11.5 Sqoop数据导出实例
  81. 11.6 小结
  82. 第12章 分布式消息队列——Kafka
  83. 12.1 什么是Kafka
  84. 12.2 Kafka的架构和主要组件
  85. 12.3 Kafka的下载与集群安装
  86. 12.4 Kafka应用实例
  87. 12.5 小结
  88. 第13章 开源的内存数据库——Redis
  89. 13.1 Redis简介
  90. 13.2 Redis安装与配置
  91. 13.3 客户端登录
  92. 13.4 Redis的数据类型
  93. 13.5 小结
  94. 第14章 Ambari和CDH
  95. 14.1 Ambari的安装与集群管理
  96. 14.2 CDH的安装与集群管理
  97. 14.3 小结
  98. 第15章 快速且通用的集群计算系统——Spark
  99. 15.1 Spark基础知识
  100. 15.2 弹性分布式数据集RDD
  101. 15.3 Spark作业运行机制
  102. 15.4 运行在YARN上的Spark
  103. 15.5 Spark集群安装
  104. 15.6 Spark实例详解
  105. 15.7 小结
  106. 第3篇 Hadoop项目案例实战
  107. 第16章 基于电商产品的大数据业务分析系统实战
  108. 16.1 项目背景、实现目标和项目需求
  109. 16.2 功能与流程
  110. 16.3 数据收集
  111. 16.4 数据预处理
  112. 16.5 数据分析——创建外部表
  113. 16.6 建立模型
  114. 16.7 数据可视化
  115. 16.8 小结
  116. 第17章 用户画像分析实战
  117. 17.1 项目背景
  118. 17.2 项目目标与项目开发过程
  119. 17.3 核心代码解读
  120. 17.4 项目部署
  121. 17.5 小结
  122. 第18章 基于个性化的视频推荐系统实战
  123. 18.1 项目背景
  124. 18.2 项目目标与推荐系统简介
  125. 18.3 推荐系统项目架构
  126. 18.4 推荐系统模型构建
  127. 18.5 核心代码
  128. 18.6 小结
  129. 第19章 电信离网用户挽留实战
  130. 19.1 商业理解
  131. 19.2 数据理解
  132. 19.3 数据整理
  133. 19.4 数据清洗
  134. 19.5 数据转换
  135. 19.6 建模
  136. 19.7 评估
  137. 19.8 部署
  138. 19.9 用户离网案例代码详解
  139. 19.10 小结