HBase面试题总结1「建议收藏」

HBase面试题总结1「建议收藏」hbase的特点是什么??1)hbase是一个分布式的基于列式存储的数据库,基于Hadoop的hdfs存储,zookeeper管理。2)hbase适合存储半结构化和非结构化数据,对于结构化数据字段不够确定或者杂乱无章很难按一个概念去抽取数据;3)hbase为空的纪录不会被存储;4)基于的表包含rowkey,时间戳,列族,新写入数据时,时间戳更新,同时可以查询到以前的版本;5)hbase是…

大家好,又见面了,我是你们的朋友全栈君。

hbase的特点是什么??
1)hbase是一个分布式的基于列式存储的数据库,基于Hadoop的hdfs存储,zookeeper管理。
2)hbase适合存储半结构化和非结构化数据,对于结构化数据字段不够确定或者杂乱无章很难按一个概念去抽取数据;
3)hbase为空的纪录不会被存储;
4)基于的表包含rowkey,时间戳,列族,新写入数据时,时间戳更新,同时可以查询到以前的版本;
5)hbase是主从架构,hmaster作为主节点,hregionserver作为从节点。
描述一下hbase的rowkey的设计原则
1)rowkey的长度原则
rowkey是一个二进制码流,rowkey的长度被很多开发者 建议设计在10-100字节,不过建议越短越好,不要超过16字节。
原因如下:
a、数据的持久化文件hfile中是按照keyvalue存储的,如果rowkey过长比如100个字节,1000万列数据光rowkey就要占用100*100万=10亿字节,将近1G数据,着就会极大的影响hfile的存储效率。
b、menstore将缓存部分数据到内存,如果rowkey字段过长内存的有效利用效率会降低,系统将无法缓存更多的数据,这会降低检索效率,因此rowkey的长度越短越好,;
c、目前操作系统都是64位系统,内存8字节对齐,控制在16字节,8字节的整数倍利用操作系统的最佳特性。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/140928.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • 车用TVS管 SM8S系列 国产替代

    车用TVS管 SM8S系列 国产替代汽车电子产品用TVS瞬态抑制二极管,首要条件就是器件要符合AEC-Q101标准,满足ISO-7637-2测试标准。目前业内比较常用的汽车级TVS二极管功率6600W,DO-218AB封装,工作电压10V-48V,不同品牌厂商对其型号命名是有差异的,比如力特(Littelfuse)是SLD8S系列,威世(Vishay)是SM8S系列,东沃(DOWO)是SM8S系列……具体型号如下:·SLD8S系列(Littelfuse品牌)型号大全:SLD8S10A、SLD8S11A、SLD8S12A、SLD8S13A

  • 局域网组建与维护期末考试题_局域网聊天程序java报告

    局域网组建与维护期末考试题_局域网聊天程序java报告局域网的组建与维护》学科期中测试题2014年秋季学期13级《局域网的组建与维护》期中测试题班别_____________姓名_____________成绩________________一、填空题(每空2分,共20分)1、计算机网络按地理位置分,可分为广域网、城域网、_局域网___。2、网线制作中,若采用T568B标准,则8针配线线序依次是白橙、橙、白绿_____蓝、白蓝、绿、白棕、棕3、两头都采…

    2022年10月29日
  • boot连接不上mysql数据库_关于springboot 连接mysql 数据库报错问题

    boot连接不上mysql数据库_关于springboot 连接mysql 数据库报错问题springboot连接MySQL运行报错:Theservertimezonevalue’Öйú±ê׼ʱ¼ä’isunrecognizedorrepresentsmorethanonetimezone.YoumustconfigureeithertheserverorJDBCdriver(viatheserverTimezoneconfi…

  • oracle数据库基础教程_象棋初学者入门教程

    oracle数据库基础教程_象棋初学者入门教程https://www.cnblogs.com/kscnchina/p/4570865.html非常非常推荐这个教程

  • python flask debug_pycharm配置debug

    python flask debug_pycharm配置debugflask项目如果在开发的时候不打开Debug模式的话,我们想要看项目中的报错信息就只能去控制台查看,会比较麻烦,而且如果不开启debug模式,我们每一次调整代码都需要将服务器重新启动,是非常麻烦的一件事,所以我们最好是将debug模式打开但是我在pycharm中使用代码开启debug模式总是打不开。使用代码打开debug模式的教程可以参考孟船长Flask第五篇—-设置debug模式的这…

  • 开曼群岛的中国大企业(Maluku_Islands)

    http://baike.baidu.com/view/29653.htm开曼群岛百科名片  开曼群岛地理位置开曼群岛(有时也译为凯门群岛)是英国在西加勒比群岛的一块海外属地,由大开曼、小开曼和开曼布拉克3个岛屿组成。开曼群岛是世界第四大离岸金融中心,并是著名的潜水胜地。 查看精彩图册

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号