注重体验与质量的电子书资源下载网站
分类于: 计算机基础 互联网 云计算&大数据 人工智能
简介
大规模分布式系统架构与设计实战 豆 4.8分
资源最后更新于 2020-03-29 05:06:52
作者:彭渊
出版社:出版社机械工业出版社
出版日期:2014-02
ISBN:9787111455035
文件格式: pdf
简介· · · · · ·
本书从作者的实战经验出发,深入浅出地讲解了如何建立一个Hadoop那样的分布式系统,实现对多台计算机CPU、内存、硬盘的统一利用,从而获取强大计算能力去解决复杂问题。一般互联网企业的分布式存储计算系统都是个大平台,系统复杂、代码庞大,而且只适合公司的业务,工程师很难下载安装到自己的电脑里学习和吃透。本书对分布式核心技术进行了大量归纳和总结,并从中抽取出一套简化的框架和编程API进行讲解,方便工程师了解分布式系统的主要技术实现。这不是一本空谈概念、四处摘抄的书,这本书包含了大量精炼示例,手把手教你掌握分布式核心技术。本书主要内容 分布式并行计算的基本原理解剖; 分布式协调的实现,包括如何实现公共配置管理,如何实现分布式锁,如何实现集群管理等; 分布式缓存的实现,包括如何提供完整的分布式缓存来利用多机内存能力; 消息队列的实现,包括如何实现发送和接收模式; 分布式文件系统的实现,包括如何像操作本地文件一样操作远程文件,并利用多机硬盘存储能力; 分布式作业调度平台的实现,包括资源隔离、资源调度等。【参考阅读】978-7-111-43052-0 大规模分布式存储系统:原理解析与架构实战978-7-111-40392-0 分布式系统:概念与设计(原书第5版)978-7-111-45244-7 Hadoop应用开发技术详解978-7-111-41766-8 Hadoop技术内幕:深入解析Hadoop Common和HDFS架构设计与实现原理978-7-111-42226-6 Hadoop技术内幕:深入解析MapReduce架构设计与实现原理978-7-111-44534-0 Hadoop技术内幕:深入解析YARN架构设计与实现原理978-7-111-43514-3 网站数据分析:数据驱动的网站管理、优化和运营978-7-111-42591-5 数据挖掘:实用案例分析彭渊 资深架构师,现任华为企业中间件首席架构师,主要负责中间件和大数据。前淘宝高级专家(花名:千峰),先后在淘宝交易、淘宝中间件、集团核心系统、阿里金融等部门工作。曾任金蝶总体架构部SOA架构师,负责设计ESB。曾艰苦创业,编写和销售财务软件。在Java技术领域从业十多年,撰写过多款开源软件,其中,淘宝分布式技术框架Fourinone为其代表作。他拥有软件著作权的代表作有:BS系列软件(包括财务进销存、OA产品、CRM等)、FMS视频会议、Flash网站生成软件(华军可下载),所有软件作品均贡献99%代码。
目录
大规模分布式系统架构与设计实战
前言
第1章 概述
1.1 分布式计算、并行计算、云计算概述
1.什么是分布式计算
2.什么是并行计算
3.并行计算与串行计算的关系
4.什么是云计算
1.2 分布式产品Hadoop、ZooKeeper、HBase概述
1.Hadoop
2.ZooKeeper
3.HBase
1.3 Fourinone的产生背景
1.使用Hadoop时碰到的问题
2.抽取一个简化的并行计算框架
第2章 分布式并行计算的原理与实践
2.1 分布式并行计算模式
2.1.1 最初想到的master-slave结构
2.1.2 “包工头-职介所-手工仓库-工人”模式
2.1.3 基于消息中枢的计算模式
2.1.4 基于网状直接交互的计算模式
2.1.5 并行结合串行模式
2.1.6 包工头内部批量多阶段处理模式
2.1.7 计算集群模式和兼容遗留计算系统
2.1.8 工人计算的服务化模式
2.2 跟Hadoop的区别
2.3 关于分布式的一些概念与产品
1.Storm
2.Spark
3.MPI
4.BSP
5.DAG
2.4 配置文件和核心API介绍
2.5 实践与应用
2.5.1 一个简单的示例
2.5.2 工头工人计算模式更完整的示例
2.5.3 工人合并互相say hello的示例
2.5.4 实现Hadoop经典实例Word Count
2.5.5 分布式多机部署的示例
2.5.6 分布式计算自动部署的示例
2.5.7 计算过程中的故障和容灾处理
2.5.8 计算过程中的相关时间属性设置
2.5.9 如何在一台计算机上一次性启动多个进程
1.如何串行或并行的启动进程
2.如何杀死进程和超时杀死进程
3.如何输出进程运行的日志信息
2.5.10 如何调用C/C++程序实现
2.5.11 如何中止工人计算和超时中止
2.5.12 使用并行计算大幅提升递归算法效率
1.单机解决方案
2.分布式并行计算解决方案
2.5.13 使用并行计算求圆周率π
2.5.14 从赌钱游戏看PageRank算法
2.5.15 使用并行计算实现上亿排序
1.为什么需要并行计算来排序
2.数据取值范围
3.输入输出数据
4.并行计算排序的详细过程
2.5.16 工人服务化模式应用示例
2.6 实时流计算
第3章 分布式协调的实现
3.1 协调架构原理简介
3.2 核心API
1.创建node
2.创建心跳属性节点
3.获取node
4.获取最新node,需要传入旧node进行对照
5.添加node的事件监听
3.3 权限机制
3.4 相对于ZooKeeper的区别
3.5 与Paxos算法的区别
3.6 实践与应用
3.6.1 如何实现公共配置管理
3.6.2 如何实现分布式锁
3.6.3 如何实现集群管理
3.6.4 多节点权限操作示例
3.6.5 领导者选举相关属性设置
第4章 分布式缓存的实现
4.1 小型网站或企业应用的缓存实现架构
4.2 大型分布式缓存系统实现过程
4.3 一致性哈希算法的原理、改进和实现
1.数据服务器发生故障的时候
2.集群服务器扩容的时候
3.集群服务器分布不均的时候
4.一致性哈希算法的改进
4.4 解决任意扩容的问题
4.5 解决扩容后数据均匀的问题
4.6 分布式Session的架构设计和实现
4.7 缓存容量的相关属性设置
4.8 缓存清空的相关属性设置
第5章 消息队列的实现
5.1 闲话中间件与MQ
5.2 JMS的两种经典模式
5.3 如何实现发送接收的队列模式
5.4 如何实现主题订阅模式
第6章 分布式文件系统的实现
6.1 FTTP架构原理解析
6.2 搭建配置FttpAdapter环境
6.3 访问集群文件根目录
6.4 访问和操作远程文件
6.5 集群内文件复制和并行复制
6.6 读写远程文件
6.7 解析远程文件
6.8 并行读写远程文件
6.9 批量并行读写远程文件和事务补偿处理
1.批量并行读
2.批量并行写
3.批量并行读写
4.事务补偿处理
6.10 如何进行整型读写
6.11 基于整型读写的上亿排序
第7章 分布式作业调度平台的实现
7.1 调度平台的设计与实现
7.2 资源隔离的实现
7.3 资源调度算法
7.4 其他作业调度平台简介
7.4.1 其他MPI作业资源调度技术
7.4.2 Mesos和Yarn简介
1.Mesos介绍
2.Yarn介绍