mysql 字符串类型 分区_MySQL分区类型

mysql 字符串类型 分区_MySQL分区类型博文大纲:1、RANGE分区2、LIST分区3、HASH分区4、key分区5、MySQL分表和分区的区别6、附加:如何实现将分区放在不同的目录下进行存储MySQL分区类型如下:RANFGE分区LIST分区HASH分区key分区上面的四种分区的条件必须是整形,如果不是整形需要通过函数将其转换为整形。1、RANGE分区RANGE分区是基于属于一个给定连续区间的列值,把多行分配给分区。这些区间要连续且不…

大家好,又见面了,我是你们的朋友全栈君。

博文大纲:

1、RANGE分区

2、LIST分区

3、HASH分区

4、key分区

5、MySQL分表和分区的区别

6、附加:如何实现将分区放在不同的目录下进行存储

MySQL分区类型如下:

RANFGE分区

LIST分区

HASH分区

key分区

上面的四种分区的条件必须是整形,如果不是整形需要通过函数将其转换为整形。

1、RANGE分区

RANGE分区是基于属于一个给定连续区间的列值,把多行分配给分区。这些区间要连续且不能相互重叠,使用values less than操作符来进行定义。

创建一个RANGE分区方式的表:

mysql> create table employees (

-> id int not null,

-> fname varchar(30),

-> lname varchar(30),

-> hired date not null default ‘1970-01-01’,

-> separated date not null default ‘9999-12-31’,

-> job_code int not null,

-> store_id int not null

-> )

-> partition by range (store_id) (

-> partition p0 values less than (6),

-> partition p1 values less than (11),

-> partition p2 values less than (16),

-> partition p3 values less than (21)

-> );

按照这种分区方案,当插入的记录store_id小于6,会保存在p0这个分区,如果store_id小于11则会将数据保存在p1这个分区…..以此类推。但是在上面的分区方案中,定义的最后一个分区是小于21的,那么,如果此时有store_id大于或等于21的记录,则会插入失败,因为数据库不知道应该插入到哪个分区中,避免这种情况的发生,就需要在指定分区方案或者新增一个分区,最后一个分区指定的范围应该为maxvalue,而不是一个具体的值。

根据上面创建的表,可以添加一个范围为maxvalue的分区,命令如下:

mysql> alter table employees add partition (partition p4 values less than maxvalue);

如果最后一个分区指定的范围是maxvalue,那么后期想要添加分区的话,需要使用以下方式(使用类似于分区合并的指令):

mysql> alter table employees reorganize partition p4 into

-> ( partition p03 values less than (25),

-> partition p04 values less than maxvalue

-> );

删除分区的指令如下(注:当分区被删除,那么分区所存储的数据也将被删除,慎用!!!):

mysql> alter table employees drop partition p2;

2、LIST分区

LIST分区类似于RANGE分区,区别在于LIST分区是基于列值匹配一个离散值集合中的某个值来进行选择。LIST分区通过使用“partition by list(expr)”来实现,其中“expr”是某列值或一个基于某个列值、并返回一个整数值的表达式,然后通过“values in(value_list)”的方式来定义每个分区,其中“value_list”是一个通过逗号分隔的整数列表。

创建LIST分区类型举例:

mysql> create table employees (

-> id int not null,

-> fname varchar(30),

-> lname varchar(30),

-> hired date not null default ‘1970-01-01’,

-> separated date not null default ‘2100-12-31’,

-> job_code int,

-> store_id int

-> )

-> partition by list(store_id)(

-> partition pNorth values in (3,5,6,9,17),

-> partition pEast values in (1,2,10,11,19,20),

-> partition pWest values in (4,12,13,14,18),

-> partition pCentral values in (7,8,15,16)

-> );

在上面创建的表中,如果插入一个store_id为22(不在定义的分列表中)的数据,那么将会插入失败,如下:

b43c9d7de2534d87a8d9dd0e9ac65f17.png

失败的原因就是:LIST分区没有类似如“VALUES LESS THAN MAXVALUE”这样的包含其他值在内的定义。将要匹配的任何值都

必须在值列表中找到。

解决办法就是增加有这个值的分区,如下:

mysql> alter table employees add partition (partition p4 values ins (22,23,24));

3、HASH分区

这种模式允许DBA通过对表的一个或多个列的Hash Key进行计算,最后通过这个Hash码不同数值对应的数据区域进行分区。 hash分区的目的是将数据均匀的分布到预先定义的各个分区中,保证各分区的数据量大致一致。在range和list分区中,必须明确指定一个给定的列值或列值集合应该保存在哪个分区中;而在hash分区中,MySQL自动完成这些工作,用户所要定一个列值或者表达式,以及指定被分区的表将要被分割成的分区数量。

1)创建hash分区的表

mysql> create table t_hash(a int(11),b datetime) partition by hash(year(b)) partitions 4;

上述创建表的命令中,使用了year函数来提取b列中的年份来做分区的依据,通过partitions来指定需要4个分区。

2)插入测试数据

mysql> insert into t_hash values(1,’2010-04-01′);

上述指令插入的数据将被存放在p2分区,计算方法如下:

8bc32587cc75b22da9f5f3ff67982baa.png

查看information_schema库中的partitions也可以查看到p2分区中会有1条记录,如下:

mysql> select * from information_schema.partitions where table_schema=’test001′ and table_name=’t_hash’\G

返回结果如下:

8d880ca9c3918dc8409e45400aab7608.png

上面的例子并不能把数据均匀的分布到各个分区,因为按照YEAR函数进行的,该值本身是离散的。如果对连续的值进行HASH分区,如自增长的主键,则可以较好地将数据平均分布。

4、key分区

key分区和hash分区相似,不同在于hash分区是用户自定义函数进行分区,key分区使用mysql数据库提供的函数进行分区,NDB cluster使用MD5函数来分区,对于其他存储引擎mysql使用内部的hash函数。

创建一个key分区的表:

mysql> create table t_key(a int(11), b datetime) partition by key(b) partitions 4;

如果后期需要新增分区,使用以下指令即可:

mysql> alter table t_key add partition partitions 5;

上述指令是新增了5个分区,也就是说,现在t_key这个表一共有9个分区了。

注: mysql-5.5开始支持COLUMNS分区,可视为RANGE和LIST分区的进化,COLUMNS分区可以直接使用非整形数据进行分区。COLUMNS分区支持以下数据类型: 所有整形,如INT SMALLINT

TINYINT BIGINT。FLOAT和DECIMAL则不支持。 日期类型,如DATE和DATETIME。其余日期类型不支持。字符串类型,如CHAR、VARCHAR、BINARY和VARBINARY。BLOB和TEXT类型不支持。 COLUMNS可以使用多个列进行分区。

5、MySQL分表和分区的区别

1) 实现方式上

mysql的分表是真正的分表,一张表分成很多表后,每一个小表都是完整的一张表,都对应三个文件,一个.MYD数据文件,.MYI索引文件,.frm表结构文件。

分区不一样,一张大表进行分区后,它还是一张表,不会变成二张表,但是它存放数据的区块变多了

2)数据处理上

分表后,数据都是存放在分表里,总表只是一个外壳,存取数据发生在一个一个的分表里面。

分区呢,不存在分表的概念,分区只不过把存放数据的文件分成了许多小块,分区后的表呢,还是一张表,数据处理还是由自己来完成。

3)提高性能上

分表后,单表的并发能力提高了,磁盘I/O性能也提高了。因为查寻一次所花的时间变短了,如果出现高并发的话,总表可以根据不同的查询,将并发压力分到不同的小表里面。

mysql提出了分区的概念,主要是想突破磁盘I/O瓶颈,想提高磁盘的读写能力,来增加mysql性能。

在这一点上,分区和分表的侧重点不同,分表重点是存取数据时,如何提高mysql并发能力上;而分区呢,如何突破磁盘的读写能力,从而达到提高mysql性能的目的。

4)实现的难易度上

分表的方法有很多,用merge来分表,是最简单的一种方式。这种方式跟分区难易度差不多,并且对程序代码来说可以做到透明的。如果是用其他分表方式就比分区麻烦了。

分区实现是比较简单的,建立分区表,和建平常的表没什么区别,并且对开代码端来说是透明的。

5) 其他区别

都能提高mysql的性高,在高并发状态下都有一个良好的表现。

分表和分区不矛盾,可以相互配合的,对于那些大访问量,并且表数据比较多的表,我们可以采取分表和分区结合的方式,访问量不大,但是表数据很多的表,我们可以采取分区的方式等。

分表技术是比较麻烦的,需要手动去创建子表,app服务端读写时候需要计算子表名。采用merge好一些,但也要创建子表和配置子表间的union关系。

表分区相对于分表,操作方便,不需要创建子表。

6、附加:如何实现将分区放在不同的目录下进行存储

先在本地创建好需要的目录:

[root@mysql ~]# mkdir /data

[root@mysql ~]# chown -R mysql.mysql /data

然后创建表时,指定data directory就可以,如下:

mysql> create table user(

-> id int not null auto_increment,

-> name varchar(30) not null default ”,

-> primary key(id)) default charset=utf8 auto_increment=1

-> partition by range(id)(

-> partition p1 values less than (3) data directory ‘/data/area1’,

-> partition p2 values less than (6) data directory ‘/data/area2’,

-> partition p3 values less than (9) data directory ‘/data/area3’);

查看本地目录,则会发现自动创建了相应的存放数据的目录,如下:

1d946a8e03b6ce9955dcab7faeb83251.png

注:使用mysql默认的存储引擎inodb时候,只需要指定data directory 就可以,因为inodb的数据和索引在一个文件中。但是创建表格时指定engine=myisam时,修改分区的存储位置,需要同时指定data directory和index directory。

———————— 本文至此结束,感谢阅读 ————————

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/133440.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • java实现定时器的四种方式_java定时器实现文字内容交换

    java实现定时器的四种方式_java定时器实现文字内容交换前言:Java定时器目前主要有3种实现方式:JDK组件,SpringTask,Quartz框架。1.JDK组件(1)java.util.TimerTaskMyTimerTask.java:publicclassMyTimerTaskextendsTimerTask{@Overridepublicvoidrun(){System.out.println(“MyTimerTask,…

  • 随机森林(原理/样例实现/参数调优)

    决策树决策树与随机森林都属于机器学习中监督学习的范畴,主要用于分类问题。决策树算法有这几种:ID3、C4.5、CART,基于决策树的算法有bagging、随机森林、GBDT等。决策树是一种利用树形结构进行决策的算法,对于样本数据根据已知条件或叫特征进行分叉,最终建立一棵树,树的叶子结节标识最终决策。新来的数据便可以根据这棵树进行判断。随机森林是一种通过多棵决策树进行优化决策的算法。案例:

  • igmp应用_udp协议端口怎么测试

    igmp应用_udp协议端口怎么测试实验3:1)准备两台机,装linux系统。两机设置好IP后均运行routeadd-net224.0.0.0netmask224.0.0.0deveth0添加到组播组2)运行make编译3)A机运行./server4)B机运行./client服务端server.c代码如下:/**broadcast_server.c-多播服务程序*/#include#include#include#include……

  • Whoosh_emil是什么意思

    Whoosh_emil是什么意思先了解基本概念和步骤:QuickStart   Whoosh是一个索引文本和搜索文本的类库,他可以为你提供搜索文本的服务,比如如果你在创建一个博客的软件,你可以用whoosh为它添加添加一个搜索功能以便用户来搜索博客的入口下面是一个简短的例子:>>>fromwhoosh.indeximportcreate_in>>>fromwhoos…

    2022年10月22日
  • Eureka&CAP原理

    Eureka&CAP原理CAP原则(CAP定理):CAP原则又称CAP定理,指的是在一个分布式系统中,Consistency(一致性)、Availability(可用性)、Partitiontolerance(分区容错性),三者不可得兼。CAP原则是NOSQL数据库的基石。Consistency(一致性)。Availability(可用性)。Partitiontolerance(分区容错性)。分布式系

  • f1-score是什么_python概念题

    f1-score是什么_python概念题一、F1score概念?F1score是分类问题的一个衡量指标,一些多分类问题的机器学习竞赛,常把F1score作为最终评测的方法。它是精确率和召回率的调和平均数,取值0-1之间。F1score认为召回率和精确率同样重要,而F2认为召回率的重要程度是精确率的2倍,F0.5则认为召回率的重要程度是精确率的一半。要明确几个概念TP(TruePositive):被判定为正样本,实际为正样本 TN(TrueNegative):被判定为负样本,实际为负样本 FP(FalseP

    2022年10月14日

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号