行存储(关系型数据库)与列存储(hbase,es聚合的doc_value)[通俗易懂]

行存储(关系型数据库)与列存储(hbase,es聚合的doc_value)[通俗易懂]1.为什么要按列存储列式存储(Columnarorcolumn-based)是相对于传统关系型数据库的行式存储(Row-basedstorage)来说的。简单来说两者的区别就是如何组织表:ØRow-basedstoragestoresatableinasequenceofrows.ØColumn-basedstoragestoresatablein…

大家好,又见面了,我是你们的朋友全栈君。

1.为什么要按列存储

列式存储(Columnar or column-based)是相对于传统关系型数据库的行式存储(Row-basedstorage)来说的。简单来说两者的区别就是如何组织表

Ø  Row-based storage stores atable in a sequence of rows.

Ø  Column-based storage storesa table in a sequence of columns.

行存储(关系型数据库)与列存储(hbase,es聚合的doc_value)[通俗易懂]

 行式存储下一张表的数据都是放在一起的,但列式存储下都被分开保存了

 

                             

行式存储

列式存储

优点

Ø  数据被保存在一起

Ø  INSERT/UPDATE容易

Ø  查询时只有涉及到的列会被读取

Ø  投影(projection)很高效

Ø  任何列都能作为索引

缺点

Ø  选择(Selection)时即使只涉及某几列,所有数据也都会被读取

Ø  选择完成时,被选择的列要重新组装

Ø  INSERT/UPDATE比较麻烦

ps:列式数据库方便projection
SQL Projection is the collective name for the columns that are Selected and returned from a query. In other words, the columns goes behind select in a query. In Oracle, a whole row is first fetched, then data values from the columns within that row are extracted into the known projection.

select某个字段就是projection。

注:关系型数据库理论回顾 – 选择(Selection)和投影(Projection)

行存储(关系型数据库)与列存储(hbase,es聚合的doc_value)[通俗易懂]

 

 

 数据压缩:通过字典表压缩数据

下面才是那张表本来的样子。经过字典表进行数据压缩后,表中的字符串才都变成数字了。正因为每个字符串字典表里只出现一次了,所以达到了压缩的目的(有点像规范化和非规范化Normalize和Denomalize)

 行存储(关系型数据库)与列存储(hbase,es聚合的doc_value)[通俗易懂]

 

 

 查询执行性能

通过一条查询的执行过程说明列式存储(以及数据压缩)的优点:

行存储(关系型数据库)与列存储(hbase,es聚合的doc_value)[通俗易懂]

关键步骤如下:

1.     去字典表里找到字符串对应数字(只进行一次字符串比较)。

2.     用数字去列表里匹配,匹配上的位置设为1

3.     把不同列的匹配结果进行位运算得到符合所有条件的记录下标。

4.     使用这个下标组装出最终的结果集

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/159119.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

  • mysql自定义函数详解_mysql自定义函数详解

    mysql自定义函数详解_mysql自定义函数详解需求:对于数据库中的记录,如果有两条连续的数据的value字段的值相同,则发邮件通知相关人员。需求分析:告警系统里面的告警检查是通过SQL来进行的,一般的SQL实现不了此功能,因此,这里可以通过函数的方式来实现。具体实现如下:1、数据表准备:tb_config_record。新建数据表脚本如下:createtabletb_config_record(idint,statusvarch…

  • ARMv8 Linux内核异常处理过程分析「建议收藏」

    ARMv8 Linux内核异常处理过程分析

  • navicat premium 15 mac 激活码-激活码分享

    (navicat premium 15 mac 激活码)最近有小伙伴私信我,问我这边有没有免费的intellijIdea的激活码,然后我将全栈君台教程分享给他了。激活成功之后他一直表示感谢,哈哈~IntelliJ2021最新激活注册码,破解教程可免费永久激活,亲测有效,下面是详细链接哦~https://javaforall.cn/100143.html…

  • linux上安装Docker(非常简单的安装方法)

    linux上安装Docker(非常简单的安装方法)最近比较有空,大四出来实习几个月了,作为实习狗的我,被叫去研究Docker了,汗汗!Docker的三大核心概念:镜像、容器、仓库镜像:类似虚拟机的镜像、用俗话说就是安装文件。容器:类似一个轻量级的沙箱,容器是从镜像创建应用运行实例,可以将其启动、开始、停止、删除、而这些容器都是相互隔离、互不可见的。仓库:类似代码仓库,是Docker集中存放镜像文件的场所。简单介绍一

  • TCP三次握手详解-深入浅出(有图实例演示)[通俗易懂]

    TCP三次握手详解-深入浅出(有图实例演示)[通俗易懂]TCP是属于网络分层中的传输层,因为OSI分为层,感觉太麻烦了,所以分为四层就好了,简单。分层以及每层的协议,如下两张图:TCP三次握手TCP三次握手简单如下图:TCP三次握手的过程描述:1.客户主动(activeopen)去connect服务器,并且发送SYN假设序列号为J,服务器是被动打开(passiveopen)2.服务器在收到SYN后,它…

  • 对BeforeSuite和BeforeTest的理解

    对BeforeSuite和BeforeTest的理解

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号