分类分类
大小:8.56 MB更新:2017/10/30
类别:程序开发系统:Winll
hadoop权威指南第四版中文版pdf未出,暂提供英文原版阅读。

hadoop权威指南第4版是一款针对于Hadoop发展现状和应用进行详细的分析讲解,由浅入深全方位介绍了Hadoop,并通过海量数据分析储存,更加清晰了解集群安装运维,高性能的分析平台和海量数据处理。欢迎来IT猫扑下载使用。
Hadoop是一个由Apache基金会所开发的分布式系统基础架构。
用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。
Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。

Tom White,数学王子&Hadoop专家。身为Apache Hadoop提交者八年之久,Apache软件基金会成员之一。全球知名云计算公司Cloudera的软件工程师。Tom拥有英国剑桥大学数学学士学位和利兹大学科学哲学硕士学位。
第3章 Hadoop分布式文件系统
当数据集的大小超过一台独立的物理计算机的存储能力时,就有必要对它进行分区(partition)并存储到若干台单独的计算机上。管理网络中跨多台计算机存储的文件系统称为分布式文件系统(distributed filesystem)。该系统架构于网络之上,势必会引入网络编程的复杂性,因此分布式文件系统比普通磁盘文件系统更为复杂。例如,使文件系统能够容忍节点故障且不丢失任何数据,就是一个极大的挑战。
Hadoop自带一个称为HDFS的分布式文件系统,即HadoopDistributed Filesystem。在非正式文档或旧文档以及配置文件中,有时也简称为DFS,它们是一回事儿。HDFS是Hadoop的旗舰级文件系统,也是本章的重点,但实际上Hadoop是一个综合性的文件系统抽象,因此接下来我们将了解将Hadoop与其他存储系统集成的途径,例如本地文件系统和Amazon S3系统。
3.1 HDFS的设计
HDFS以流式数据访问模式来存储超大文件,运行于商用硬件集群上。①让我们仔细看看下面的描述。
* 超大文件 “超大文件”在这里指具有几百MB、几百GB甚至几百TB大小的文件。目前已经有存储PB级数据的Hadoop 集群了。②
* 流式数据访问 HDFS的构建思路是这样的:一次写入、多次读取是最高效的访问模式。数据集通常由数据源生成或从数据源复制而来,接着长时间在此数据集上进行各种分析。每次分析都将涉及该数据集的大部分数据甚至全部,因此读取整个数据集的时间延迟比读取第一条记录的时间延迟更重要。
* 商用硬件 Hadoop并不需要运行在昂贵且高可靠的硬件上。它是设计运行在商用硬件(在各种零售店都能买到的普通硬件③)的集群上的,因此至少对于庞大的集群来说,节点故障的几率还是非常高的。HDFS遇到上述故障时,被设计成能够继续运行且不让用户察觉到明显的中断。
同样,那些不适合在HDFS上运行的应用也值得研究。目前HDFS对某些应用领域并不适合,不过以后可能会有所改进。
准备好释放数据的强大潜能了吗?借助于这本本书,你将学习如何使用ApacheHadoop构建和维护稳定性高、伸缩性强的分布式系统。本书是为程序员写的,可帮助他们分析任何大小的数据集。本书同时也是为管理员写的,帮助他们了解如何设置和运行Hadoop集群。
c语言从入门到精通电子版程序开发45.80 MB完整版扫描版
详情arm体系结构与编程最新版程序开发114.60 MB杜春雷著
详情html手册完整版程序开发8.45 MB中文版
详情stm32库开发实战指南 电子书程序开发117.00 MB完整版
详情python学习手册 第5版 pdf程序开发13.30 MB中文完整版
详情java从入门到精通第三版程序开发486.00 MB电子版完整版
详情c++从入门到精通 第二版 pdf程序开发157.00 MB高清版
详情stm32从入门到精通电子版程序开发32.00 MB高清完整版
详情vb从入门到精通第三版pdf程序开发20.00 MB电子版
详情C/C++程序员面试宝典(梁镇宇)程序开发28.81 MBpdf高清版
详情c#入门经典第7版电子档程序开发148.73 MB中文版
详情C陷阱与缺陷高清pdf程序开发4.70 MBpdf高清完整版
详情creo 2.0中文版从入门到精通程序开发115.00 MB电子版
详情实战java虚拟机 jvm故障诊断与性能优化pdf程序开发42.00 MB完整版电子版
详情matlab从入门到精通程序开发2.20 MB免费版
详情Linux从入门到精通(第2版)pdf程序开发5.16 MB高清免费版
详情精通正则表达式第三版程序开发53.15 MB高清PDF中文版
详情系统分析师教程张友生pdf高清版程序开发105.30 MB2010最新版
详情python基础教程第二版修订版程序开发30.47 MBpdf中文高清免费版
详情跟老齐学python从入门到精通电子书程序开发4.31 MB完整版
详情点击查看更多
java从入门到精通第三版程序开发486.00 MB电子版完整版
详情python学习手册 第5版 pdf程序开发13.30 MB中文完整版
详情程序员教程软考指定用书(第3版)程序开发28.77 MB最新2009高清PDF版
详情软件设计师教程(第2版)程序开发91.00 MBpdf版
详情Redhat LINUX 9从入门到精通程序开发42.62 MB免费版
详情hadoop权威指南第5版电子书程序开发0.00 B完整扫描版
详情c++从入门到精通 第二版 pdf程序开发157.00 MB高清版
详情周志明深入理解java虚拟机 第三版 pdf程序开发0.00 B电子版
详情stm32从入门到精通电子版程序开发32.00 MB高清完整版
详情系统分析师教程张友生pdf高清版程序开发105.30 MB2010最新版
详情vue.js权威指南电子版程序开发97.70 MB高清版
详情数据结构教材(严蔚敏编著)程序开发27.90 MBPDF高清版
详情hadoop权威指南第四版中文版电子书程序开发8.56 MBpdf版本
详情谭浩强C程序设计完整ppt和程序第五版程序开发5.47 MB免费版
详情深入浅出python电子书程序开发0.00 B完整版
详情Python程序设计基础程序开发2.95 MBpdf高清电子版
详情程序员教程第4版(软考指定用书)程序开发9.90 MB2014免费版
详情c#入门经典第7版电子档程序开发148.73 MB中文版
详情runoob菜鸟教程离线版程序开发12.40 MB免费版
详情vb从入门到精通第三版pdf程序开发20.00 MB电子版
详情点击查看更多
j2ee经典学习教程(独家推荐)程序开发14.32 MBpdf高清版
详情Redhat LINUX 9从入门到精通程序开发42.62 MB免费版
详情实战java虚拟机 jvm故障诊断与性能优化pdf程序开发42.00 MB完整版电子版
详情runoob菜鸟教程离线版程序开发12.40 MB免费版
详情c++primer第5版中文版pdf程序开发0.00 B中英超清电子版
详情精通python爬虫框架scrapy epub+azw3+mobi程序开发0.00 B
详情matlab数值计算pdf程序开发15.24 MB免费版
详情opengl编程指南第7版程序开发22.79 MBpdf 中文扫描版
详情jQuery API 3.2.1 中文手册程序开发999.00 KBchm版
详情php7.3.8离线中文手册程序开发31.59 MB官方版
详情深入浅出google android pdf程序开发58.00 MB完整版扫描版_E2ECloud工作室
详情周志明深入理解java虚拟机 第三版 pdf程序开发0.00 B电子版
详情python学习手册 第4版程序开发0.00 B
详情php5.6中文手册程序开发18.50 MB官方版
详情hadoop权威指南第三版中文pdf程序开发111.80 MB电子书
详情数值方法matlab版第四版程序开发20.60 MB高清完整版
详情opengl编程指南第9版程序开发5.90 MBpdf 高清版
详情html5参考手册中文版程序开发182.00 KB官方完整版
详情小程序巧应用微信小程序开发实战pdf程序开发72.58 MB高清完整版
详情PHP7.2中文手册程序开发30.20 MB官方版
详情点击查看更多










