(10)Hadoop2.0主流开源云架构之Hadoop简述
时间:2019-06-13
本文章向大家介绍(10)Hadoop2.0主流开源云架构之Hadoop简述,主要包括(10)Hadoop2.0主流开源云架构之Hadoop简述使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
1.Hadoop的由来
2002年,开源组织Apache成立开源搜索引擎项目Nutch
2004年,Apache实现了Nutch版的NDFS和MapReduce
2006年,NDFS和MapReduce移出Nutch,形成独立项目,称为Hadoop。
Hadoop采用客户-服务器模式,Hadoop 2.0很容易从一台机器扩展至成千上万台机器,并且每台机器都能提供本地计算存储和本地计算。
考虑到集群中每台机器都可能会出问题(如硬件失效),Hadoop 2.0本身从设计上就在程序层规避了这些问题。
Hadoop的组成:
Hadoop至少应当包含分布式存储和分布式计算两个模块
(1)HDFS Hadoop的分布式文件系统。
主要提供分布式存储服务。
(2)Hadoop MapReduce 分布式计算框架。
主要负责资源管理、任务调度和MapReduce算法实现。
(3)Hadoop Common
联系HDFS和MapReduce的纽带,它一方面为另外两组件提供一些公用jar包,另一方面也是程序员访问其他两模块的接口。
(4)Yarn 分布式操作系统
2.Hadoop的相关项目
Google云计算组件和Hadoop及其相关项目之间的对应关系:
3.Hadoop的应用
(1)构建大型分布式集群
(2)数据仓库
(3)数据挖掘
原文地址:https://www.cnblogs.com/paradis/p/11017459.html
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- Python 为什么用 # 号作注释符?
- Logging with ElasticSearch, Kibana, ASP.NET Core and Docker
- 【DB笔试面试843】在Oracle中,解释GLOBAL_NAMES设为TRUE的用途。
- SpringBoot 返回 json 数据以及数据封装(万字长文)
- 内核级木马与病毒攻防:Linux可执行文件的ELF格式描述
- 「 思考 」 React Hooks 的设计哲学
- JMeter之Json提取器详解
- nodejs 图片处理工具 gm 的使用!
- Java 进程内存分布
- Web 游戏监听浏览器返回点击事件 !
- 权限维持_Linux操作系统后门
- Linux入门学习笔记(一)
- CMD命令笔记总结
- 字典生成神器Crunch
- DC-5靶机渗透实战