HDFS是GFS的简化版,它同一时刻只允许一个用户对同一文件进行追加写操作(GFS允许并发写).它适合存储大文件,并提供高吞吐量的顺序读/写访问. 它的早期版本两大问题,例如:单点失效和水平扩展不佳.针对这两个问题,在hadoop2.0提出统一的解决方案,即HA和NameNode联盟. HDFS的设计目标 存储大文件 文件一次写(支持追加写)/顺序读 HDFS优点: 适合大数据处理(支持GB,TB,PB级别的数据存储,支持百万规模以上的文件数量) 适合批处理(支持离线的批量数据处理,支持高吞吐率…