hadoop3.x教程(一)
1、Hadoop概述
1.1、Hadoop优点
高可靠性:Hadoop底层维护多个数据副本,即使Hadoop某个计算元素或存储出现故障也不会导致数据的流失。高扩展性:在集群分配任务数据,可方便地扩展节点。高效性:在MapReduce的思想下,Hadoop是并行工作的,加快任务处理速度高容错性:能够自动将失败的任务重新分配
1.2、Hadoop3.x组成
Hadoop3.x组成和2.x没有区别,内置组件分别有MapReduce(计算),Yarn(资源调度),HDFS(数据存储),Common(辅助工具)四种
1.3、HDFS架构概述
HDFS(Hadoop Distributed File System),是一个分布式文件系统 内置三种组件,NameNode,DataNode,SecondaryNameNode
NameNode(nn):存储文件的元数据,如文件名,文件目录结构,文件属性(生
hadoop3.x教程(一)最先出现在Python成神之路。
共有 0 条评论