什么是Apache Hadoop? 在Apache Hadoop的项目开发可靠,可扩展,分布式计算开源软件. Apache Hadoop的软件库是一个框架,允许分布式处理大型数据集在集群计算机使用简单的编程模型. 它被设计为从单一服务器扩展到数千台机器,每个提供本地计算和存储. 而不是依赖于硬件,以提供高可用性,图书馆本身是设计在应用层的故障检测和处理,所以计算机集群上提供高度可用的服务,这可能是容易失败. 该项目包括以下模块: Hadoop Common:常用的工具支持其他Hadoop模块.…