【MapReduce篇01】MapReduce之入门概述(附思维导图资料)
先知道是什么,再去了解为什么
MapReduce入门概述
MapReduce定义
MapReduce是一个基于Hadoop的分布式运算程序的编程框架
它的核心功能是将用户编写的业务逻辑代码和自带的组件组合成为一个完整的分布式运算程序,并发的运行在Hadoop集群上。
MapReduce优点
MapReduce易于编程:简单的实现一些接口就可以实现分布式程序,并且这个分布式程序可以分布到大量廉价的PC机器上执行。良好的扩展性:加机器就可以增加计算能力高容错性:所谓容错就是当系统中一台机器故障时候,有一种机制可以将任务分配到新机器上然后继续运行,这个过程是不需要人工干涉的适合PB级上数据的离线处理:大数据的稳定处理
MapReduce缺点
不擅长实时计算:MapReduce不能像Mysql,在毫秒级或秒级返回结果不擅长流式计算:流式计算输入数据是动态的,连续不断的,但是MR处理
共有 0 条评论