Hadoop生态系统组件最全介绍

Hadoop生态系统组件最全介绍开源改变世界,拥抱开源,拥抱未来Hadoop生态系统组件介绍,掌握吹x大法,走到哪里都不怕图片来自bing,跟视觉中国没关系,嗯,很严肃的声明 功能模块 产品名称 产品简述 关键技术 HDFS 分布式文件系统 MapReduce 数据处理编程:map(数据拆分),shuffle(数据排序分发),reduce(数据合并) YAR…

大家好,又见面了,我是你们的朋友全栈君。

开源改变世界,拥抱开源,拥抱未来

Hadoop生态系统组件介绍,掌握吹x大法,走到哪里都不怕

 

æ¥çæºå¾å
图片来自bing,跟视觉中国没关系,嗯,很严肃的声明

 

 
功能模块 产品名称 产品简述
关键技术 HDFS 分布式文件系统
MapReduce 数据处理编程:map(数据拆分),shuffle(数据排序分发),reduce(数据合并)
YARN 资源管理系统
Spark 基于内存计算,完全不同与MapReduce的编程方式,常用SQL形式实现

数据库及

数据管理

Cassandra 键值存储Nosql数据库
Hbase 键值存储Nosql数据库,通常不直接用mapreduce来写而是通过pig等找接口调用
Memcached 完全基于内存的数据库
MongoDB 文档型数据库
Hive 不是每个人都会写MR,所以需要写SQL来转换调用MR,即HiveSQL
Spark SQL 用类Hive的语言来写Spark
Graph 图表数据库
序列化 Avro 数据序列化,并且有上传分享链接
JSON 一种数据结构,描述数据和传输数据
管理与监控 Zookeeper 分布式协调系统
Chef     节点管理
Puppet 节点管理
Nagios 基础设施监控
Ambari 配置,监控和管理hadoop的平台
HCatalog 数据抽象层
Oozie 工作流调度管理
Ganglia 监控系统
分析辅助 MR接口 早期调整的方案,现在几乎不用
分析库 自行搭建的分析平台,如算法
Pig MR是汇编,Pig就是Python,让代码更加简便,类SQL语言。与HIve的区别是Hive适合静态数仓,Pig更加轻量适合开发者和应用调用
Hadoop Streaming 使用Java外的语言来编写MR
Mahout 机器学习和数据分析
MLLib Spark的专属机器学习工具
HIPI 图像处理接口
数据传输 Sqoop 在HDFS与RDBMS之间传递数据
Flume 数据收集,尤其是日志数据
DistCp Hadoop集群之间移动数据
Storm 流数据摄取

云计算与

虚拟化

Serengeti Hadoop虚拟化,即部署在公有云,好处是加快配置集群的速度,无需再购买配置硬件;快速增加或减少集群大小来应对实际业务需求;可提高容错性,从错误中快速恢复。缺点是MR和YARN在虚拟化环境中无法完全控制计算机资源;数据布局很关键,三副本,一致性等等都需要考虑
Docker 运行应用程序的容器,也包括Hadoop节点
Whirr 集群快速配置

安全访问与

控制

Sentry 基础身份验证服务和权限控制
Kerberos 安全认证
Knox 安全网关

 

Hadoop生态系统组件最全介绍
图片来自本人,跟视觉中国没关系,嗯,很严肃的声明

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/144581.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

  • 计算机中1kb表示的字节数是多少_在计算机中1KB是指几字节

    计算机中1kb表示的字节数是多少_在计算机中1KB是指几字节大家好,我是时间财富网智能客服时间君,上述问题将由我为大家进行解答。1kb等于1024个字节。kB(Kilobyte),是一种资讯计量单位,是计算机数据存贮器存储单位字节的多倍形式。现今通常在标识内存等具有一般容量的储存媒介之储存容量时使用。根据国际单位制标准,1kB=1000B(字节,Byte)。根据按照IEC命名标准,用于二进制存储单位的标准命名是KiB,MiB等,1kiB=1024B。这是由…

  • C++和Java中STL库入门[通俗易懂]

    C++和Java中STL库入门[通俗易懂]C++和Java中STL库入门STL简介为什么使用STLSTL基本概念STL使用前的初始化C++里STL基本容器详解STL简介STL简称标准模版库,被容纳在C++标准程序库,包含了许多基本数据结构和基本算法,使程序员写起来得心应手。为什么使用STL在学习数据结构的时候,在程序中会使用到堆、栈、队列、链表等一些基本的算法,而学习数据结构的时候,这些基本算法写起来十分繁琐,如果不想写这些,那么就可以考虑一下STL了。但是不要太过于依赖STL!STL基本概念要使用STL,需要理解以下几个基本概念:

  • python怎么保留四位小数_jq四舍五入取小数点后两位

    python怎么保留四位小数_jq四舍五入取小数点后两位在很多场景的计算中,最终得到的数值例如123.45678,要截取2位小数得到123.45,而不是默认的四舍五入方法得到123.46,如何实现呢?一.小数点后取2位(四舍五入)的方法方法一:round()函数方法二:’%.2f’%f方法方法三:Decimal()函数二.小数点后取2位(四舍五不入)的方法方法一:一.小数点后取2位(四舍五入…

  • java.sql.SQLException: ORA-01008: 并非所有变量都已绑定的解决方法「建议收藏」

    java.sql.SQLException: ORA-01008: 并非所有变量都已绑定的解决方法「建议收藏」错误:在使用PreparedStatement的时候,可以很好地避免像Statement的sql注入问题,但是在这里使用PreparedStatement对象和使用Statement对象来执行sql语句有一定的区别。PreparedStatement的对象通过:PreparedStatementp=con.preparedStatement(str);来执行sql语句,其中str是s…

  • FilterRegistrationBean_hid event filter

    FilterRegistrationBean_hid event filter3.4  Struts 2的基本流程 经过前面介绍,我们已经基本了解了Struts 2框架的MVC实现。大致上,Struts 2框架由3个部分组成:核心控制器FilterDispatcher、业务控制器和用户实现的业务逻辑组件。在这3个部分里,Struts 2框架提供了核心控制器FilterDispatcher,而用户需要实现业务控制器和业务逻辑组件。 3.4.1  核心控制器:Filte

  • K8s基本概念入门_k8s菜鸟教程

    K8s基本概念入门_k8s菜鸟教程序言    没等到风来,绵绵小雨,所以写个随笔,聊聊k8s的基本概念。    k8s是一个编排容器的工具,其实也是管理应用的全生命周期的一个工具,从创建应用,应用的部署,应用提供服务,扩容缩容应用,应用更新,都非常的方便,而且可以做到故障自愈,例如一个服务器挂了,可以自动将这个服务器上的服务调度到另外一个主机上进行运行,无需进行人工干涉。那么,问题来了,要运维何用?    k8s可以更快的更新新版

    2022年10月22日

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号