Hadoop Distributed File System:分布式文件系统. HDFS基于流数据模式访问和处理超大文件需求开发,具有高容错性,高可靠性,高可扩展性,多部署在低成本的硬件上.HDFS提供对应用程序数据的高吞吐量访问,便利了海量数据的处理 介绍 假设和目标 硬件故障:检测故障并从中快速恢复 流式数据访问 HDFS设计用于批处理而非用户的交互使用 重点是数据访问的高吞吐量而非低延迟 大数据集 HDFS上运行的应用程序具有大型数据集,支持大文件 应为单个集群中的数百个结点提供高聚合数据…