官方介绍
HDFS( Hadoop Distributed File System) 是Hadoop下的 分布式文件系统个,具有分布式、高吞吐等特性,并可以利用低成本的硬件。
HDFS 组件
HDFS遵从主/从架构,由单个主NN(NameNode)和多个DN(DataNode)组成:
DataNode :负责提供来自文件系统客户端的读写请求,执行块的创建、删除等操作。
NameNode :负责执行有关 文件系统命名空间的操作,例如打开、关闭、重命名文件和目录等。它同时还负责集群元数据的存储,记录着文件中各个数据块的位置信息。
文件命名空间
HDFS的 文件系统命名空间 的层次结构与大多数文件系统类似(Linux)