logo
分类于: 计算机基础 云计算&大数据 人工智能

简介

Hadoop集群与安全: 大数据技术丛书

Hadoop集群与安全: 大数据技术丛书 0.0分

资源最后更新于 2020-03-29 03:31:28

作者:〔美〕扎伯瑞福斯基(Danil Zburivsky)〔美〕娜拉燕南(Sudheesh Narayanan)

译者:刘杰沈鑫

出版社:出版社机械工业出版社

出版日期:2014-11

ISBN:9787111480624

文件格式: pdf

标签: 计算机 大数据 大数据技术丛书 数据处理软件

简介· · · · · ·

Hadoop自动化安装和配置的问题在于隐藏了许多Hadoop组件协同工作的重要细节,本书介绍如何手动安装和配置主要的Hadoop组件,以便高效使用Hadoop平台。通过设置一个完全可运行的集群,可对Hadoop内部的运行机制产生更深入的了解,并且有助于你调试任何可能发生的问题。本书还介绍了保障基于Hadoop的大数据平台安全的实现方案和最佳实践,覆盖Kerberos安全协议和Hadoop安全机制的设计,并包括在企业内部来确保Hadoop及其生态系统相关组件安全的详细方案。作者:Danil Zburivsky,资深数据库管理员,目前是全球数据基础构架管理公司Pythian的咨询师,其客户涉及金融、娱乐以及通信领域,主要方向是创建各种Hadoop集群。研究兴趣包括Python编程、机器学习等。Sudheesh Narayanan,在大数据解决方案咨询与实施领域具有丰富经验的实践者和技术战略家。他在IT领域的经验超过15年,涉及信息管理、商务智能、大数据分析及云应用和J2EE应用开发等。译者:刘杰,中国科学院软件所副研究员,具有多年Hadoop平台研发与实施经验,与团队一起研发基于Hadoop的可视化大数据分析工具Haflow,该工具应用于医疗、交通等多个领域。研究方向包括企业数据集成、面向大数据的系统软件、数据挖掘等。沈鑫,毕业于同济大学计算机科学与技术系,资深网络工程师,从事网络安全、管理信息系统的开发与维护,参与开发了多个相关的项目。兴趣爱好是网络安全技术与嵌入式技术。

想要: 点击会收藏到你的 我的收藏,可以在这里查看

已收: 表示已经收藏

Tips: 注册一个用户 可以通过用户中心得到电子书更新的通知哦

目录

  1. 译者序
  2. 作者简介
  3. 审校者简介
  4. 前言
  5. 第1章 构建Hadoop集群
  6. 1.1 选择Hadoop集群硬件
  7. 1.1.1 选择DataNode硬件
  8. 1.1.2 低存储密度集群
  9. 1.1.3 高存储密度集群
  10. 1.1.4 NameNode和JobTracker硬件配置
  11. 1.1.5 网关和其他辅助服务
  12. 1.1.6 网络配置
  13. 1.1.7 Hadoop硬件总结
  14. 1.2 Hadoop发行版
  15. 1.2.1 Hadoop版本
  16. 1.2.2 选择Hadoop发行版
  17. 1.2.3 Cloudera Hadoop发行版
  18. 1.2.4 Hortonworks Hadoop发行版
  19. 1.2.5 MapR
  20. 1.3 为Hadoop集群选择操作系统
  21. 1.4 小结
  22. 第2章 安装和配置Hadoop
  23. 2.1 在Hadoop集群中配置操作系统
  24. 2.1.1 选择和设置文件系统
  25. 2.1.2 设置Java开发包
  26. 2.1.3 其他操作系统设定
  27. 2.1.4 设置CDH存储库
  28. 2.2 设置NameNode
  29. 2.2.1 JournalNode节点、ZooKeeper以及故障转移控制器
  30. 2.2.2 Hadoop配置文件
  31. 2.2.3 NameNode高可用方案配置
  32. 2.2.4 JobTracker配置
  33. 2.2.5 DataNode配置
  34. 2.3 小结
  35. 第3章 配置Hadoop生态系统
  36. 3.1 托管Hadoop生态项目
  37. 3.2 Sqoop
  38. 3.2.1 安装和配置Sqoop
  39. 3.2.2 Sqoop导入示例
  40. 3.2.3 Sqoop导出示例
  41. 3.3 Hive
  42. 3.3.1 Hive架构
  43. 3.3.2 安装Hive Metastore
  44. 3.3.3 安装Hive客户端
  45. 3.3.4 安装Hive Server
  46. 3.4 Impala
  47. 3.4.1 Impala架构
  48. 3.4.2 安装Impala state store
  49. 3.4.3 安装Impala server
  50. 3.5 小结
  51. 第4章 Hadoop安全
  52. 4.1 Hadoop安全概述
  53. 4.2 Hadoop分布式文件系统安全
  54. 4.3 MapReduce安全
  55. 4.4 Hadoop服务级别验证
  56. 4.5 Hadoop和Kerberos
  57. 4.5.1 Kerberos概述
  58. 4.5.2 Hadoop中的Kerberos
  59. 4.6 小结
  60. 第5章 监控Hadoop集群
  61. 5.1 监控策略介绍
  62. 5.2 Hadoop参数
  63. 5.2.1 JMX参数
  64. 5.2.2 使用Nagios监控Hadoop
  65. 5.2.3 监控Hadoop分布式文件系统
  66. 5.2.4 NameNode校验
  67. 5.2.5 JournalNode检查
  68. 5.2.6 ZooKeeper检查
  69. 5.3 监控MapReduce
  70. 5.4 使用Ganglia监控Hadoop
  71. 5.5 小结
  72. 第6章 在云端使用Hadoop
  73. 6.1 Amazon Elastic MapReduce
  74. 6.1.1 安装EMR命令行接口
  75. 6.1.2 选择Hadoop版本
  76. 6.1.3 启动EMR集群
  77. 6.2 使用Whirr
  78. 6.3 小结
  79. 第7章 Hadoop平台安全概述
  80. 7.1 为什么需要保障Hadoop生态系统的安全
  81. 7.2 确保Hadoop生态系统安全面临的挑战
  82. 7.3 关键安全因素
  83. 7.4 小结
  84. 第8章 Hadoop安全体系设计
  85. 8.1 什么是Kerberos
  86. 8.1.1 Kerberos关键术语
  87. 8.1.2 Kerberos如何工作
  88. 8.1.3 Kerberos的优点
  89. 8.2 不采用Kerberos的Hadoop默认安全模型
  90. 8.3 Hadoop Kerberos安全模型实现
  91. 8.3.1 用户层次的访问控制
  92. 8.3.2 服务层次的访问控制
  93. 8.3.3 用户和服务认证
  94. 8.3.4 授权令牌
  95. 8.3.5 作业令牌
  96. 8.3.6 数据块访问令牌
  97. 8.4 小结
  98. 第9章 配置一个安全Hadoop集群
  99. 9.1 前提条件
  100. 9.2 设置Kerberos
  101. 9.3 配置Hadoop使用Kerberos认证
  102. 9.3.1 在所有Hadoop节点设置Kerberos客户端
  103. 9.3.2 配置Hadoop服务标识
  104. 9.4 Hadoop用户设置
  105. 9.5 安全Hadoop自动部署
  106. 9.6 小结
  107. 第10章 Hadoop生态系统安全保障
  108. 10.1 为Hadoop生态系统组件配置Kerberos
  109. 10.1.1 Hive安全设置
  110. 10.1.2 Oozie安全设置
  111. 10.1.3 Flume安全设置
  112. 10.1.4 HBase安全设置
  113. 10.1.5 Sqoop安全设置
  114. 10.1.6 Pig安全设置
  115. 10.2 Hadoop生态系统组件安全保障最佳实践
  116. 10.3 小结
  117. 第11章 集成Hadoop与企业安全系统
  118. 11.1 集成EIM系统
  119. 11.1.1 配置EIM与Hadoop集成
  120. 11.1.2 集成基于Active Directory的EIM系统与Hadoop生态系统
  121. 11.2 从企业网络访问安全Hadoop集群
  122. 11.2.1 HttpFS
  123. 11.2.2 HUE
  124. 11.2.3 Knox Gateway Server
  125. 11.3 小结
  126. 第12章 Hadoop中敏感数据安全保护
  127. 12.1 Hadoop中敏感数据及保护方法
  128. 12.2 小结
  129. 第13章 安全事件与审计日志
  130. 13.1 Hadoop集群安全事故和事件监控
  131. 13.2 Hadoop集群审计日志设置
  132. 13.3 小结
  133. 附录 Hadoop安全机制解决方案
  134. A.1 支持安全机制的Hadoop发布版本
  135. A.2 安全Hadoop集群的自动化部署
  136. A.3 不同的Hadoop数据加密方案
  137. A.4 使用Rhino项目实现安全Hadoop生态系统
  138. A.5 安全技术与参考架构的映射