列式数据库概述_列式数据库多张表

列式数据库概述_列式数据库多张表阐述列式数据库的基本定义,现状,以及一些开源数据库的性能比较。

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

0、一张图描述列式数据库与行式数据库区别:

image

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1、 列式数据库应用于对表中部分字段进行查询,或者是所谓的“大表”。

2、 大多数列式数据库不需要索引,因为列本身就是索引

3、 列式数据库能够自动评估逻辑和物理上的IO消耗,所以他不需要分区,也不需要物化视图。读取数据时,

      只跟当前列数据所在存储设备发生IO操作,基本上占传统数据库的10%。

4、 一般上讲,列式数据库的查询性能比传统行数据库快5—10倍,同时随着数据量成倍地增加,查询性能变

      化不会很大,基本上在一个数量级。

5、 列式数据库的物理文件小,压缩比基本上是传统的10-40倍;由于列数据类型相同,所以可以根绝不同

      的数据类型来压缩。

6、 什么情况下不适合用列式数据库:

  •  
    • 大多数情况下都是用select * 类似的查询,这时候列式数据库没有任何性能优势。
    • 频繁的单个的insert和delete操作
    • 小型数据库,性能提升不明显
    • 换句话说,传统的OLTP业务不适合列式数据库

7、 什么情况下适合用列式数据库

  •  
    • 非事务、非实时、非多并发的数据仓库的构建
    • 数据变化小,如日志,汇总的大量数据等
    • 换句话说,列式数据库适用于典型的BI分析和DW构建等应用场景。

8、 随着应用需求由简单的交易业务转向分析业务,套用SAP-Sybase(被SAP收购)的话“列式数据库正是在分析系统领域(OLAP)里最好的技术”。

9、 一种新观点——“5年内可能会,大多数数据仓库将以列模式存储;大多数 OLTP 数据库将可能是内存数据库 (IMDB),或完全驻留在内存内;大多数大型数据库服务器将通过集群方式进行横向扩展”。

10、 看看现在巨头们都有哪些列式数据库:

  •  
    • IBM:2010年大型机上推出智能分析优化器(SAO),自称列式设备。
    • Oracle:Oracle 11gR2中提供了针对它自己Exadata系统的列式存储技术
    • SAP-Sybase:Sybase IQ,据说人家十年前就研究这个了。
    • 开源:绝大部分是作为Mysql的数据存储引擎,如InfoBright, InfiniDB等。其中LucidDB的特点主要有:
      • i. 专门用于数据仓库和BI分析
      • ii. 以位图索引,Hash Join,聚合以及页级多版本并发控制技术为基础构建。
      • iii. 存储引擎上层采用Java实现,提供基于Java的扩展接口
      • iv. 与mondrian结合紧密,同时有针对ETL功能的优化。

11、 LucidDB及其他开源列式存储引擎性能基准测试:

http://www.percona.com/docs/wiki/benchmark:ssb:start

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:http://www.javaforall.cn/234957.html原文链接:http://www.javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

  • 2018年小米高级 PHP 工程师面试题(模拟考试卷)

    2018年小米高级 PHP 工程师面试题(模拟考试卷)

  • 计算机网络基础(路由器的作用 MAC地址 IP地址 IP地址分类 子网掩码 网段,等长子网划分)

    计算机网络基础(路由器的作用 MAC地址 IP地址 IP地址分类 子网掩码 网段,等长子网划分)前言在上一篇我们聊到了简单的了解到了计算机的通信方式,并且都是处于同一个网段下的通信,简要理解(大局观)计算机之间的通信方式【同一网段】(直接相连,同轴电缆,集线器,网桥,交换机),今天我们聊聊路由器和MAC地址IP地址的基础知识文章目录前言计算机之间连接方式—路由器连接MAC地址IP地址IP地址的分类计算机之间连接方式—路由器连接我们知道如果全世界都用交换机连接网络的话,会导致广播风暴,即,当在由交换机连接网络的时候,两台计算机通信,首先会发ARP广播得到对方的MAC地址,于此同时交换机就会记

  • mysql 驱动jar包下载_mysql驱动jar包

    mysql 驱动jar包下载_mysql驱动jar包mysql驱动就是赋值外界与数据的连接接口。请注意JDBC连接MySql,其驱动程序与MySQL的版本有关!!要使用相匹配的驱动程序,并将驱动程序加到CLASSPATH中。在系FTP服务器上,/数据库/MySql目录下的驱动程序如下:MySql5.0 驱动程序包为mysql-connector-java-5.0.4.zip(内有.jar文件即驱动程序)MySql4.0 驱动程序为mysqldriv…

  • Android—Gradle教程(九)完结篇

    Android—Gradle教程(九)完结篇前言到目前为止,Gradle基础以及Kotlin基础讲解完毕。因此,在本篇里,将会以Gradle的构建优化以及如何从Groovy迁移到KTS进行详解!话不多说,直接开始!1、Gradle构建优化优化都是些配置,快速过一下就行了!重点在迁移KTS1.1并行编译开启默认情况下Gradle处理多模块时,往往是挨个按顺序处理。在项目根目录下面的gradle.properties中设置开启并行编译,提升编译速度:org.gradle.parallel=true1.2开启编译守护进程(默认开启)

  • docker部署web项目_小钢炮docker安装web

    docker部署web项目_小钢炮docker安装web前言前面我们运行的容器并没有一些什么特别的用处。接下来让我们尝试使用docker构建一个web应用程序。我们将在docker容器中运行一个PythonFlask应用来运行一个web

  • time_npl_timebeginperiod

    time_npl_timebeginperiod文章目录作用1准备1.1LunarSolarConverter.py1.2RangeTimeEnum.py1.3StringPreHandler.py1.4TimeNoemalizer.py1.5TimeUnit.py2测试3时间的正则表达式regex.txt信息来源Coconlp作用用于句子中时间词的抽取和转换res=tn.parse(target=u’过十分钟’)#target为待分析语句,timeBase为基准时间默认是当前时间print(res)

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号