mysql8分区表_MySQL 分区表[通俗易懂]

mysql8分区表_MySQL 分区表[通俗易懂]MySQL分区就是将一个表分解为多个更小的表。从逻辑上讲,只有一个表或一个索引,但在物理上这个表或者索引可能由多个物理分区组成。每个分区在物理上都是独立的。MySQL数据库分区类型:Range分区:行数据基于属于一个给定连续区间的列值放入分区。List分区:和Range分区类似,只是List分区面向的是离散的值。Hash分区:根据用户自定义的表达式的返回值来进行分区,返回值不能为负数。Key分区:…

大家好,又见面了,我是你们的朋友全栈君。

MySQL分区就是将一个表分解为多个更小的表。从逻辑上讲,只有一个表或一个索引,但在物理上这个表或者索引可能由多个物理分区组成。每个分区在物理上都是独立的。MySQL数据库分区类型:Range分区:行数据基于属于一个给定连续区间的列值放入分区。

List分区:和Range分区类似,只是List分区面向的是离散的值。

Hash分区:根据用户自定义的表达式的返回值来进行分区,返回值不能为负数。

Key分区:根据MySQL数据库提供的哈希函数来进行分区。

Columns分区:Range分区和List分区的扩展,支持非整型的分区条件。

子分区(复合分区):MySQL数据库允许在Range和List的分区上再进行Hash或者Key的子分区。

不论创建何种类型的分区,如果表中存在主键或唯一索引时,分区列必须是唯一索引的一个组成部分。

1. Range分区

用法示例:create table t_range(

id int) engine=innodb

partition by range(id) (

partition p0 values less than (10),

partition p1 values less than (20),

partition p2 values less than maxvalue);

上面例子表示创建了一个id列的区间分区表,当id<10时,数据会插入p0分区。当10<=id<20时,数据会插入p0分区,id>=20时,数据会插入p2分区。maxvalue表示正无穷大。分区表会在磁盘上为每个分区创建一个文件,如下:# ls -lh t_range*

-rw-r—– 1 mysql mysql 8.4K 8月 17 19:25 t_range.frm

-rw-r—– 1 mysql mysql 96K 8月 17 19:25 t_range#P#p0.ibd

-rw-r—– 1 mysql mysql 96K 8月 17 19:25 t_range#P#p1.ibd

-rw-r—– 1 mysql mysql 96K 8月 17 19:25 t_range#P#p2.ibd

插入几条数据,查看数据在各分区的分布情况:mysql> insert into t_range values (1), (2), (10), (15), (16), (20), (22), (24), (25);

Query OK, 9 rows affected (0.10 sec)

Records: 9 Duplicates: 0 Warnings: 0

mysql> select * from information_schema.partitions where table_schema=database() and table_name=’t_range’\G

*************************** 1. row ***************************

TABLE_CATALOG: def

TABLE_SCHEMA: mytest

TABLE_NAME: t_range

PARTITION_NAME: p0

SUBPARTITION_NAME: NULL

PARTITION_ORDINAL_POSITION: 1

SUBPARTITION_ORDINAL_POSITION: NULL

PARTITION_METHOD: RANGE

SUBPARTITION_METHOD: NULL

PARTITION_EXPRESSION: id

SUBPARTITION_EXPRESSION: NULL

PARTITION_DESCRIPTION: 10

TABLE_ROWS: 2

AVG_ROW_LENGTH: 8192

DATA_LENGTH: 16384

MAX_DATA_LENGTH: NULL

INDEX_LENGTH: 0

DATA_FREE: 0

CREATE_TIME: 2020-08-17 19:25:02

UPDATE_TIME: 2020-08-17 19:40:16

CHECK_TIME: NULL

CHECKSUM: NULL

PARTITION_COMMENT:

NODEGROUP: default

TABLESPACE_NAME: NULL

*************************** 2. row ***************************

TABLE_CATALOG: def

TABLE_SCHEMA: mytest

TABLE_NAME: t_range

PARTITION_NAME: p1

SUBPARTITION_NAME: NULL

PARTITION_ORDINAL_POSITION: 2

SUBPARTITION_ORDINAL_POSITION: NULL

PARTITION_METHOD: RANGE

SUBPARTITION_METHOD: NULL

PARTITION_EXPRESSION: id

SUBPARTITION_EXPRESSION: NULL

PARTITION_DESCRIPTION: 20

TABLE_ROWS: 3

AVG_ROW_LENGTH: 5461

DATA_LENGTH: 16384

MAX_DATA_LENGTH: NULL

INDEX_LENGTH: 0

DATA_FREE: 0

CREATE_TIME: 2020-08-17 19:25:02

UPDATE_TIME: 2020-08-17 19:40:16

CHECK_TIME: NULL

CHECKSUM: NULL

PARTITION_COMMENT:

NODEGROUP: default

TABLESPACE_NAME: NULL

*************************** 3. row ***************************

TABLE_CATALOG: def

TABLE_SCHEMA: mytest

TABLE_NAME: t_range

PARTITION_NAME: p2

SUBPARTITION_NAME: NULL

PARTITION_ORDINAL_POSITION: 3

SUBPARTITION_ORDINAL_POSITION: NULL

PARTITION_METHOD: RANGE

SUBPARTITION_METHOD: NULL

PARTITION_EXPRESSION: id

SUBPARTITION_EXPRESSION: NULL

PARTITION_DESCRIPTION: MAXVALUE

TABLE_ROWS: 4

AVG_ROW_LENGTH: 4096

DATA_LENGTH: 16384

MAX_DATA_LENGTH: NULL

INDEX_LENGTH: 0

DATA_FREE: 0

CREATE_TIME: 2020-08-17 19:25:02

UPDATE_TIME: 2020-08-17 19:40:16

CHECK_TIME: NULL

CHECKSUM: NULL

PARTITION_COMMENT:

NODEGROUP: default

TABLESPACE_NAME: NULL

3 rows in set (0.00 sec)

PARTITION_METHOD表示分区类型,TABLE_ROWS列表示分区中记录的数量,可以看到p0分区有2条记录,p1分区有3条记录,p2分区有4条记录。

2. List分区

List分区和Range分区相似,只是分区列是离散的。用法如下:create table t_list (

a int,

b int) engine=innodb

partition by list(b)(

partition p0 values in (1,3,5,7,9),

partition p1 values in (0,2,4,6,8));

创建List分区表是,同一个数值不能出现两次,否则会报错ERROR 1495 (HY000): Multiple definition of same constant in list partitioning。

3. Hash分区

Hash分区的目的是将数据均匀地分布到预先定义地各个分区中,保证各分区地数据数量大致都是一样的。在Range和List分区中,必须明确指定一个给定的列值或列值集合应该保存在哪个分区,而在Hash分区中,MySQL自动完成这些工作,我们所要做的只是基于将要被哈希的列值指定一个列值或表达式,以及指定被分区的表将要被分割成的分区数量。

Hash分区表用法如下:以YEAR(b)做hash,分区数据量是4。create table t_hash (

a int,

b datetime) engine=innodb

partition by hash (YEAR(b))

partitions 4;

MySQL还支持一种称为Linear Hash的分区,它的用法跟Hash分区一样,只是将关键字Hash改为Linear Hash。Linear Hash分区使用了一个更加复杂的算法来做hash函数。Linear Hash分区的优点在于增加、删除、合并、拆分分区效率更高,有利于处理数据量大的表;缺点是数据分布不大均衡。

4. Key分区

Key分区和Hash分区相似,不同在于,Hash分区使用用户指定的函数进行分区,Key分区无需明确指定函数,会自动使用MySQL数据库提供的函数进行分区。Key分区也可以使用关键字Linear。用法如下:create table t_key (

a int,

b datetime) engine=innodb

partition by key (b)

partitions 4;

5. Columns分区

Range、List、Hash、Key这四种分区中,分区的条件必须是整型,如果不是整型,需要通过Year()、Month()等函数将其转化为整型。Columns分区可以直接使用非整型的数据进行分区,分区根据类型直接比较而得,不需要转化为整型。Range Columns分区还可以对多个列的值进行分区。Columns分区支持:所有整型、日期类型(Date、Datetime)、字符串类型(Blob、Text不支持)。用法如下:create table t_columus_range(

a int,

b datetime) engine=innodb

partition by range columns (b) (

partition p0 values less than (‘2019-01-01’),

partition p1 values less than (‘2020-01-01’));

# 使用多个列进行分区

create table t_range_columns_mult (

a int,

b int,

c char(3),

d int) engine=innodb

partition by range columns (a,b,c)(

partition p0 values less than (5, 10, ‘sdd’),

partition p1 values less than (10, 20, ‘xxx’),

partition p2 values less than (maxvalue, maxvalue, maxvalue));

6. 子分区

子分区是在分区的基础上再进行分区,也称复合分区。MySQL允许在Range和List的分区上再进行Hash或Key的子分区。用法如下:# 一下只指定了每个分区的子分区数量为2,没有指定每个分区的名称。

create table t_sub (

a int,

b date) engine=innodb

partition by range(year(b))

subpartition by hash(to_days(b))

subpartitions 2 (

partition p0 values less than (1990),

partition p1 values less than (2000),

partition p2 values less than maxvalue);

# 看下物理上的分布

ls -lh t_sub*

-rw-r—– 1 mysql mysql 8.4K 8月 18 11:46 t_sub.frm

-rw-r—– 1 mysql mysql 96K 8月 18 11:46 t_sub#P#p0#SP#p0sp0.ibd

-rw-r—– 1 mysql mysql 96K 8月 18 11:46 t_sub#P#p0#SP#p0sp1.ibd

-rw-r—– 1 mysql mysql 96K 8月 18 11:46 t_sub#P#p1#SP#p1sp0.ibd

-rw-r—– 1 mysql mysql 96K 8月 18 11:46 t_sub#P#p1#SP#p1sp1.ibd

-rw-r—– 1 mysql mysql 96K 8月 18 11:46 t_sub#P#p2#SP#p2sp0.ibd

-rw-r—– 1 mysql mysql 96K 8月 18 11:46 t_sub#P#p2#SP#p2sp1.ibd

# 也可以显示指定每个子分区的名称

create table t_sub_named (

a int,

b date) engine = innodb

partition by range(year(b))

subpartition by hash(to_days(b))(

partition p0 values less than (1990) (

subpartition s0,

subpartition s1),

partition p1 values less than (2000) (

subpartition s2,

subpartition s3),

partition p2 values less than maxvalue(

subpartition s4,

subpartition s5));

子分区的建立需要注意以下几个问题:每个分区下的子分区的数量必须相同。

如果在分区表的任何分区上使用subpartition来明确定义任何子分区,那么就必须定义所有的子分区。

可以使用subpartitions只指定子分区的数量,MySQL会自动为每个子分区分配名称。如果使用了subpartition,则每个subpartition字句都必须包括子分区的名称,且每个子分区的名称必须唯一。

7. 分区中的NULL值

MySQL允许对NULL值做分区,并且会把NULL值视为小于任何一个非NULL值。对于Range分区,NULL值会被插入最左边的分区。

对于List分区,必须显示指出NULL值放入哪个分区。

对于Hash和Key分区,任何分区函数都会将含有NULL值的记录返回为0。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/132172.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(1)


相关推荐

  • exponential backoff algorithm「建议收藏」

    exponential backoff algorithm「建议收藏」在看NDN的默认转发策略BestRouteStrategy中提到了指数退避算法,回忆了一下,即为:在一个共享信道的情况下,当网络上的节点在发生冲突时,每个节点节点等待一定的时间后重新发送。在二进制指数退避算法中,等待时间随着以二为底的指数增长。如果重试失败,那么下次的等待时间将会是上次的等待时间二倍。如果重试次数大于最大重试次数,那么包将从包队列中去除。

  • 使用joi来验证数据模型[通俗易懂]

    使用joi来验证数据模型[通俗易懂]我们用nodejs实现一些功能时,往往需要对用户输入的数据进行验证。然而,验证是一件麻烦的事情,很有可能你需要验证数据类型,长度,特定规则等等,在前端做表单验证时,我们常用的做法是使用正则,正则表达式

  • LoadLibrary failed with error 1114:动态链接库(DLL)初始化例程失败 解决方法「建议收藏」

    LoadLibrary failed with error 1114:动态链接库(DLL)初始化例程失败 解决方法「建议收藏」LoadLibraryfailedwitherror1114:动态链接库(DLL)初始化例程失败解决方法

  • java用正则表达式大全_Java 正则表达式 大全「建议收藏」

    java用正则表达式大全_Java 正则表达式 大全「建议收藏」什么是正则表达式?正则表达式的定义:这是一种字符串的语法规则,是一种可以用于模式匹配和替换的规则,主要用于文本和字符串的处理(匹配,查找,替换,判断字符串)。一个正则表达式是由普通的字符(a~z)以及特殊字符(元字符)组成的文字模式,用以描述在查找文字主体时待匹配的一个或多个字符串。下面我们会介绍一些常用的元字符正则表达式的元字符元字符的定义:元字符:元字符使得正则表达式具有处理能力,指的是那些在…

  • 怎么检查计算机和打印机是否连接网络,检查电脑是否正确连接网络打印机

    怎么检查计算机和打印机是否连接网络,检查电脑是否正确连接网络打印机我们有时候会在电脑中连接网络打印机来进行打印工作。可是有用户会遇到文件无法打印的问题。那么这个时候应该怎么检查电脑中是否已成功连接网络打印机?对此,我们可以参考以下方法来进行操作。1、如果文件打印不了,按Crtl+P打开打印对话框,在打印机名称中看看有没有网络打印机的名称,如果没有则说明打印机驱动有问题,需要重新安装网络打印机的驱动程序;2、如果有显示打印机名称,那么问题有可能是网络连接错误或者打…

  • G1收集器详解「建议收藏」

    G1收集器详解「建议收藏」CMS垃圾收集器的弊端:会产生内存碎片&&需要预留空间。这两个问题在处理时,很有可能会导致停顿时间过长,即CMS的停顿时间不可预知。所以G1又可以理解为在CMS垃圾收集器上进行了”升级”。G1垃圾收集器可以给你设定一个你希望Stoptheworld停顿时间,G1会根据这个时间尽量满足你。在JVM堆中,堆的内存分布是以物理空间进行隔离——但是在G1垃圾收集器中,堆的划分不再是物理形式,而是以逻辑的形式进行划分。但是,分代的概念在G1中依旧奏效,比如,新对象一般会被分配.

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号