HDFS是一个分布式文件存储系统,前身来自于Google发布的大数据三驾马车之一GFS (Google File System). HDFS的优点: 1.高容错 hdfs具有很高的容错性,数据自动保存为多个副本,默认为三副本机制,还能够通过自己自定义副本数来提高容错性. 当某个节点的副本丢失后,可以通过其他的备份副本进行恢复. 2.块存储 hdfs中的文件是以块的形式进行存储的,hadoop2.x后的版本默认为128m为一块. 128m为一块是由最佳传输损耗原理来得到的数字,当一个文件大小为12…