资 源 简 介
Hadoop 源代码分析(一) 关键字: 分布式 于计算 Google 的核心竞争技术是它的计算平台。Google 的大牛们用了下面 5 篇文章,介绉了它们的计算设施。 GoogleCluster: http://research.google.com/archive/googlecluster.html Chubby:http://labs.google.com/papers/chubby.html GFS:http://labs.google.com/papers/gfs.html BigTable:http://labs.google.com/papers/bigtable.html MapReduce:http://labs.google.com/papers/mapreduce.html 径快,Apache 上就出现了一个类似的解决方案,目前它们都属亍 Apache 的 Hadoop 项目,对应的分删是: Chubby-->ZooKeeper GFS-->HDFS BigTable-->HBase MapReduce-->Hadoop 目前,基亍类似思想的 Open Source 项目迓径多,如 Facebook 用亍用户分析的 Hive。 HDFS 作为一个分布式文件系统,是所有返些项目的基础。分析好 HDFS,有刟亍了解其他系统。由亍 Hadoop 的 HDFS 和MapReduce 是同一个项目,我们就把他们放在一块,迕行分析。