我爱电子书-《Hadoop应用开发技术详解》| pdf + epub + mobi + awz3, 高清版, 带目录，Kindle版, 多看精排版下载

注重体验与质量的电子书资源下载网站

分类于: 编程语言计算机基础互联网云计算&大数据人工智能

简介

Hadoop应用开发技术详解豆 6.0分

资源最后更新于 2020-03-29 02:48:53

作者：刘刚

出版社：出版社机械工业出版社

出版日期：2014-01

ISBN：9787111452447

文件格式： pdf

标签：互联网技术大数据 Java Hadoop 应用开发

简介· · · · · ·

本书共12章。第1～2章详细地介绍了Hadoop的生态系统、关键技术以及安装和配置；第3章是MapReduce的使用入门，让读者了解整个开发过程；第4～5章详细讲解了分布式文件系统HDFS和Hadoop的文件I/O；第6章分析了MapReduce的工作原理；第7章讲解了如何利用Eclipse来编译Hadoop的源代码，以及如何对Hadoop应用进行测试和调试；第8～9章细致地讲解了MapReduce的开发方法和高级应用；第10～12章系统地讲解了Hive、HBase和Mahout。刘刚著

直接下载

简介

Hadoop应用开发技术详解 豆 6.0分

简介· · · · · ·

目录

前言

为什么要写这本书

读者对象

如何阅读本书

勘误和支持

致谢

第1章 Hadoop概述

1.1 Hadoop起源

1.1.1 Google与Hadoop模块

1.1.2 为什么会有Hadoop

1.1.3 Hadoop版本介绍

1.2 Hadoop生态系统

1.3 Hadoop常用项目介绍

1.4 Hadoop在国内的应用

1.5 本章小结

第2章 Hadoop安装

2.1 Hadoop环境安装配置

2.1.1 安装VMware

2.1.2 安装Ubuntu

2.1.3 安装VMware Tools

2.1.4 安装JDK

2.2 Hadoop安装模式

2.2.1 单机安装

2.2.2 伪分布式安装

2.2.3 分布式安装

2.3 如何使用Hadoop

2.3.1 Hadoop的启动与停止

2.3.2 Hadoop配置文件

2.4 本章小结

第3章 MapReduce快速入门

3.1 WordCount实例准备开发环境

3.1.1 使用Eclipse创建一个Java工程

3.1.2 导入Hadoop的JAR文件

3.2 MapReduce代码的实现

3.2.1 编写WordMapper类

3.2.2 编写WordReducer类

3.2.3 编写WordMain驱动类

3.3 打包、部署和运行

3.3.1 打包成JAR文件

3.3.2 部署和运行

3.3.3 测试结果

3.4 本章小结

第4章 Hadoop分布式文件系统详解

4.1 认识HDFS

4.1.1 HDFS的特点

4.1.2 Hadoop文件系统的接口

4.1.3 HDFS的Web服务

4.2 HDFS架构

4.2.1 机架

4.2.2 数据块

4.2.3 元数据节点

4.2.4 数据节点

4.2.5 辅助元数据节点

4.2.6 名字空间

4.2.7 数据复制

4.2.8 块备份原理

4.2.9 机架感知

4.3 Hadoop的RPC机制

4.3.1 RPC的实现流程

4.3.2 RPC的实体模型

4.3.3 文件的读取

4.3.4 文件的写入

4.3.5 文件的一致模型

4.4 HDFS的HA机制

4.4.1 HA集群

4.4.2 HA架构

4.4.3 为什么会有HA机制

4.5 HDFS的Federation机制

4.5.1 单个NameNode的HDFS架构的局限性

4.5.2 为什么引入Federation机制

4.5.3 Federation架构

4.5.4 多个名字空间的管理问题

4.6 Hadoop文件系统的访问

4.6.1 安全模式

4.6.2 HDFS的Shell访问

4.6.3 HDFS处理文件的命令

Hadoop应用开发技术详解豆 6.0分

第1章　Hadoop概述

1.1　Hadoop起源

1.1.1　Google与Hadoop模块

1.1.2　为什么会有Hadoop

1.1.3　Hadoop版本介绍

1.2　Hadoop生态系统

1.3　Hadoop常用项目介绍

1.4　Hadoop在国内的应用

1.5　本章小结

第2章　Hadoop安装

2.1　Hadoop环境安装配置

2.1.1　安装VMware

2.1.2　安装Ubuntu

2.1.3　安装VMware Tools

2.1.4　安装JDK

2.2　Hadoop安装模式

2.2.1　单机安装

2.2.2　伪分布式安装

2.2.3　分布式安装

2.3　如何使用Hadoop

2.3.1　Hadoop的启动与停止

2.3.2　Hadoop配置文件

2.4　本章小结

第3章　MapReduce快速入门

3.1　WordCount实例准备开发环境

3.1.1　使用Eclipse创建一个Java工程

3.1.2　导入Hadoop的JAR文件

3.2　MapReduce代码的实现

3.2.1　编写WordMapper类

3.2.2　编写WordReducer类

3.2.3　编写WordMain驱动类

3.3　打包、部署和运行

3.3.1　打包成JAR文件

3.3.2　部署和运行

3.3.3　测试结果

3.4　本章小结

第4章　Hadoop分布式文件系统详解

4.1　认识HDFS

4.1.1　HDFS的特点

4.1.2　Hadoop文件系统的接口

4.1.3　HDFS的Web服务

4.2　HDFS架构

4.2.1　机架

4.2.2　数据块

4.2.3　元数据节点

4.2.4　数据节点

4.2.5　辅助元数据节点

4.2.6　名字空间

4.2.7　数据复制

4.2.8　块备份原理

4.2.9　机架感知

4.3　Hadoop的RPC机制

4.3.1　RPC的实现流程

4.3.2　RPC的实体模型

4.3.3　文件的读取

4.3.4　文件的写入

4.3.5　文件的一致模型

4.4　HDFS的HA机制

4.4.1　HA集群

4.4.2　HA架构

4.4.3　为什么会有HA机制

4.5　HDFS的Federation机制

4.5.1　单个NameNode的HDFS架构的局限性

4.5.2　为什么引入Federation机制

4.5.3　Federation架构

4.5.4　多个名字空间的管理问题

4.6　Hadoop文件系统的访问

4.6.1　安全模式

4.6.2　HDFS的Shell访问

4.6.3　HDFS处理文件的命令

4.7　Java API接口

4.7.1　Hadoop URL读取数据

4.7.2　FileSystem类

4.7.3　FileStatus类

4.7.4　FSDataInputStream类

4.7.5　FSDataOutputStream类

4.7.6　列出HDFS下所有的文件

4.7.7　文件的匹配

4.7.8　PathFilter对象