Haddop学习笔记---HDFS体系结构

前端之家收集整理的这篇文章主要介绍了Haddop学习笔记---HDFS体系结构前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。

HDFS的概念

数据块

  • HDFS的块默认为64M。

  • HDFS上的文件被划分为块大小的多个分块,作为独立的存储单元。

  • hadoop fsck / -files -blocks 可以看各个文件由哪些块构成。

namenode和datanode

  • namenode是管理者,datanode是工作者。

  • namenode

    • namenode管理文件系统的命名空间。

    • 记录每个文件中各个块所在的数据节点信息。

    • namenode在内存中保存文件系统中的每个文件和每个数据块的引用关系。

  • datanode

    • 负责所在物理节点的存储管理。

    • 根据需要存储并检索数据块。

    • 一次写入多次读取。

读取数据流程

  1. 客户端要访问HDFS中的一个文件

  2. 首先从namenode获得组成这个文件的数据块位置列表。

  3. 根据列表知道数据块的datanode

  4. 访问datanode获取数据。

namenode并不参与数据实际传输。

安全模式

bin/hadoop dfsadmin safemode enter
bin/hadoop dfsadmin safemode leave

猜你在找的程序笔记相关文章