MySQL分区表技术解析

bitscn.com
mysql分区概述：
允许根据可以设置为任意大小的规则，跨文件系统分配单个表的多个部分。实际上，表的不同部分在不同的位置被存储为单独的表。用户所选择的、实现数据分割的规则被称为分区函数，这在mysql中它可以是模数，或者是简单的匹配一个连续的数值区间或数值列表，或者是一个内部hash函数，或一个线性hash函数。函数根据用户指定的分区类型来选择，把用户提供的表达式的值作为参数。该表达式可以是一个整数列值，或一个作用在一个或多个列值上并返回一个整数的函数。[z1] 。这个表达式的值传递给分区函数，分区函数返回一个表示那个特定记录应该保存在哪个分区的序号。这个函数不能是常数，也不能是任意数。它不能包含任何查询，但是实际上可以使用mysql 中任何可用的sql表达式，只要该表达式返回一个小于maxvalue（最大可能的正整数）的正数值。
由于mysql无全局索引的概念，只有本地分区索引，基于此种原因，一个表中如果有2个或2个以上的唯一索引，此表无法分区。分区函数应用的数据库的列必须是mysql的主键，否则不能分区。[z2]
对于创建了分区的表，可以使用你的mysql 服务器所支持的任何存储引擎。在mysql 5.1版中，同一个分区表的所有分区必须使用同一个存储引擎；例如，不能对一个分区使用myisam，而对另一个使用innodb。但是，这并不妨碍在同一个 mysql 服务器中，甚至在同一个数据库中，对于不同的分区表使用不同的存储引擎。
mysql分区的建立
mysql可以建立四种分区类型的分区：
          range 分区：基于属于一个给定连续区间的列值，把多行分配给分区。详情参见18.2.1节，“range分区”。
·         list 分区：类似于按range分区，区别在于list分区是基于列值匹配一个离散值集合中的某个值来进行选择。详情参见18.2.2节，“list分区”。
·         hash分区：基于用户定义的表达式的返回值来进行选择的分区，该表达式使用将要插入到表中的这些行的列值进行计算。这个函数可以包含mysql 中有效的、产生非负整数值的任何表达式。详情参见18.2.3节，“hash分区”。
·         key 分区：类似于按hash分区，区别在于key分区只支持计算一列或多列，且mysql 服务器提供其自身的哈希函数。必须有一列或多列包含整数值。详情参照：18.2.4. key分区。
        子分区：子分区是分区表中每个分区的再次分割。书写格式参照：18.2.5. 子分区
        （1）关于子分区应注意的地方：每个分区必须有相同数量的子分区。
·       （2）如果在一个分区表上的任何分区上使用subpartition 来明确定义任何子分区，那么就必须定义所有的子分区。
在建立分区的时候可以指定分区的数据存储位置和索引位置，这样可以跨磁盘或者文件系统保存不同的数据。数据分磁盘存储可以一定程度上增加数据读取速度，因为采用多磁盘后，每个磁盘的i/o操作会降低。而且采用指定分区存储位置能够增大存储量。
无论使用何种类型的分区，分区总是在创建时就自动的顺序编号，且从0开始记录，记住这一点非常重要。当有一新行插入到一个分区表中时，就是使用这些分区编号来识别正确的分区。例如，如果你的表使用4个分区，那么这些分区就编号为0, 1, 2, 和3。对于range和list分区类型，确认每个分区编号都定义了一个分区，很有必要。对hash分区，使用的用户函数必须返回一个大于0的整数值。对于key分区，这个问题通过mysql服务器内部使用的哈希函数自动进行处理。注意：分区的名字是不区分大小写的，且对于range分区和list分区，分区的名称是不能重复的。这几种可根据不同的需求来选择，比较常用的是range分区。
常用的mysql的分区管理：
range 和list分区管理
         分区对于程序来说是透明的，而且只有删除能在分区层面上操作，其他如查询、修改、增加都不能指定分区。
alter table …droppartition ….(删除分区)
alter table … add partition (partition p3 valuesless than (…));[z3] 增加分区
alter table ... reorganize partition …,… into (
   partition p0 values less than (…)
)；[z4] 合并拆分分区。
hash和key分区管理
         添加分区和range、list分区方式相同，对于修改分区，不能使用与从按照range或list分区的表中删除分区相同的方式，来从hash或key分区的表中删除分区。但是，可以使用“altertable ... coalesce partition”命令来合并hash或key分区。
如果要查看分区的信息，可以通过sql语句来查询
select * from information_schema.partitions wheretable_schema = schema() and table_name='xxx’
分区表效率比较
mysql分区表实验
分区采用红色，不分区采用蓝色
测试环境：centos 虚拟机，1g内存，20g硬盘
实验数据库：test 不分区（内有1张表rpt_malevents）、test2（与test一样）
背景数据：
mysql> select count(*)from rpt_malevents;
+----------+
| count(*) |
+----------+
| 17082107 |
+----------+
1 row in set (10.84 sec)
mysql> selectcount(*) from rpt_malevents;
+----------+
| count(*) |
+----------+
| 17082107 |
+----------+
1 row in set (14.63sec)
数据分布：2011/8/4~2011/8/17
分区表结构：
createtable `rpt_malevents` (
`record_date` date not null,
`record_hour` tinyint(2) not null,
`record_minute` tinyint(2) not null,
`record_datetime` datetime not null,
`mc_ip` int(10) unsigned not null,
`pc_ip` int(10) unsigned not null,
`netobject_group_id` smallint(5) defaultnull,
`alert_type` tinyint(3) not null,
`sub_type` smallint(5) not null,
`show_type` smallint(5) not null,
`alert_id` tinyint(3) not null,
`event_count` int(10) unsigned default null,
primary key(`record_date`,`record_hour`,`record_minute`,`mc_ip`,`pc_ip`,`alert_type`,`sub_type`,`alert_id`),
key `record_datetime` (`record_datetime`)
)engine=innodb default charset=utf8 collate=utf8_unicode_ci /*!50100 partitionby range (to_days(record_date)[z1] ) (partition p2011 values less than (734503)engine = innodb, partition p20110809 values less than (734724) engine = innodb,partition p20110810 values less than (734725) engine = innodb, partitionp20110811 values less than (734726) engine = innodb, partition p20110812 valuesless than (734727) engine = innodb, partition p20110813 values less than(734728) engine = innodb, partition p20110814 values less than (734729) engine= innodb, partition p20110815 values less than (734730) engine = innodb,partition p20110816 values less than (734731) engine = innodb, partitionp20110817 values less than (734732) engine = innodb, partition p20110818 valuesless than (734733) engine = innodb, partition pmax values less than maxvalue[z2] engine = innodb)
分区表的物理存储如下，当前用的是innodb的存储引擎，采用分表结构
分析如下
(条件查询查询全部数据)
mysql> selectcount(*) from rpt_malevents where record_date > '2011-08-01' and record_date +----------+
| count(*) |
+----------+
| 17082107 |
+----------+
1 row in set (21.62sec)
mysql> selectcount(*) from rpt_malevents where record_date > '2011-08-01' and record_date +----------+
| count(*) |
+----------+
| 17082107 |
+----------+
1 row in set (29.20sec)
(查询部分数据，不使用分区函数使用的列)
mysql> selectcount(*) from rpt_malevents where record_datetime > '2011-08-02' andrecord_datetime +----------+
| count(*) |
+----------+
| 5083194 |
+----------+
1 row in set (2.83sec)
mysql> selectcount(*) from rpt_malevents where record_datetime > '2011-08-02' and record_datetime +----------+
| count(*) |
+----------+
| 5083194 |
+----------+
1 row in set (5.60sec)
(使用其他条件查询部分数据)
mysql> selectcount(*) from rpt_malevents where alert_type = 1;
+----------+
| count(*) |
+----------+
|    88739 |
+----------+
1 row in set (8.49sec)
select count(*) fromrpt_malevents where alert_type = 1;
+----------+
| count(*) |
+----------+
|    88739 |
+----------+
1 row in set (12.88sec)
(小范围查询,在一个分区内查询)
mysql> selectcount(*) from rpt_malevents where record_date > '2011-08-13' and record_date +----------+
| count(*) |
+----------+
| 2116249 |
+----------+
1 row in set (1.85sec)
mysql> selectcount(*) from rpt_malevents where record_date > '2011-08-13' and record_date +----------+
| count(*) |
+----------+
| 2116249 |
+----------+
1 row in set (3.10sec)
分析sql语句的执行过程
rows表示mysql根据表统计信息及索引选用情况，估算的找到所需的记录所需要读取的行数。
mysql>explain   partitions select * fromrpt_malevents where record_datetime > '2011-08-12' and record_datetime ***************************1. row ***************************
           id: 1
select_type: simple
        table: rpt_malevents
   partitions: p2011,p20110809,p20110810,p20110811,p20110812,p20110813,p20110814,p20110815,p2011[z3] 0816,p20110817,p20110818,pmax
         type: range
possible_keys:record_datetime
          key: record_datetime
      key_len: 8
          ref: null
         rows: 355911[z4]
        extra: using where
1 row in set (0.00sec)
mysql> explain select * from rpt_malevents whererecord_datetime > '2011-08-12' and record_datetime ***************************1. row ***************************
           id: 1
select_type: simple
        table: rpt_malevents
         type: range
possible_keys:record_datetime
          key: record_datetime
      key_len: 8
          ref: null
         rows: 1002288[z5]
        extra: using where
1 row in set (0.00sec)
与分区函数使用列无关的查询条件
mysql>explain   partitions select count(*) fromrpt_malevents where alert_type = 1/g;
***************************1. row ***************************
           id: 1
select_type: simple
        table: rpt_malevents
   partitions: p2011,p20110809,p20110810,p20110811,p20110812,p20110813,p20110814,p20110815,p20110816,p20110817,p20110818,pmax[z6]
         type: index
possible_keys: null
          key: record_datetime
      key_len: 8
          ref: null
         rows: 17084274[z7]
        extra: using where; using index
1 row in set (0.00sec)
mysql> explainselect count(*) from rpt_malevents where alert_type = 1/g;
***************************1. row ***************************
           id: 1
select_type: simple
        table: rpt_malevents
         type: index
possible_keys: null
          key: record_datetime
      key_len: 8
          ref: null
         rows: 17082459
        extra: using where; using index
1 row in set (0.00sec)
采用分区函数使用的列
mysql> explainpartitions select count(*) from rpt_malevents where record_date >'2011-08-09' and record_date ***************************1. row ***************************
           id: 1
select_type: simple
        table: rpt_malevents
   partitions: p20110810,p20110811,p20110812,p20110813,p20110814,p20110815[z8]
         type: range
possible_keys:primary
          key: primary
      key_len: 3
          ref: null
         rows: 3767081[z9]
        extra: using where; using index
1 row in set (0.08sec)
mysql> explainpartitions select count(*) from rpt_malevents where record_date >'2011-08-09' and record_date ***************************1. row ***************************
           id: 1
select_type: simple
        table: rpt_malevents
   partitions: null
         type: range
possible_keys:primary
          key: primary
      key_len: 3
          ref: null
         rows: 8541229[z10]
        extra: using where; using index
1 row in set (0.00sec)
删除数据，如果删除1整天的数据，由于我们采用按天分区，
mysql> alter tablerpt_malevents drop partition p20110809;[z11]
query ok, 0 rowsaffected (0.65 sec)
records: 0 duplicates: 0 warnings: 0
删除后包含索引的和数据的rpt_malevents#p#p20110809.ibd被删除了
如果采用传统的不分区的方式删除。
mysql> delete fromrpt_malevents where record_date query ok, 3929328rows affected (1 min 29.68 sec)
由此可见，删除整个分区内的数据还是很快的，
如果分区表采用传统的方式删除：
mysql> deletefrom rpt_malevents where record_date query ok, 1153866rows affected (19.72 sec)
mysql> delete fromrpt_malevents where record_date query ok, 1153866rows affected (18.75 sec)
采用传统的方式删除一天的数据，用的时间都差不多。
只删除数据后，数据分区配p20110810还在，而且大小不变。可以用alter table t1 optimize partition来进行回收，但是mysql5.1.22还没有实现。
跨分区删除。
delete fromrpt_malevents where alert_type =1;
query ok, 63969 rowsaffected (55.20 sec)
delete fromrpt_malevents where alert_type =1;
query ok, 63969 rowsaffected (50.26 sec)
分区表删除比不分区的略慢
[z1]分区函数
[z2]分区信息，从2011-08-09开始
[z3]没有用分区函数使用的列会扫描所有分区
[z4]数据量为681311，分区后扫描行数为355911，虽然查询条件没有分区函数的列，但是mysql的查询优化器会将其对应于时间分区，这样可以减少扫描行数
[z5]数据量为681311，分区后扫描行数为1002288
[z6]查找所有分区
[z7]无关分区函数的字段，会遍历几乎所有行。
[z8]扫描部分分区
[z9]扫描行数随之减少
[z10]估计扫描的行数
[z11]这个分区的数据是所有2011-8-10之前的所有数据，共3929328。
总结：
分区表是在mysql5.1中新增的的功能，截止到mysql5.1.22-rc,分区技术并不很成熟，很多分区的维护和管理功能未实现。如，分区内数据存储空间的回收、分区的修复、分区的优化等，mysql的分区可以用在可以按分区删除的表中，且对数据库的修改操作不大，且频繁按照分区字段进行查询的表中（如恶意代码中的统计表按天分区，经常按照时间进行查询、分组等，且可以按天删除分区）。此外，由于mysql无全局索引只有分区索引，当一张有2个唯一索引[z5] 的时候，不能将此表分区，分区列中必须包含主键。否则mysql会报错。
总之，mysql对于分区的限制很多，且个人认为hash和key的分区实际意义不是太大。
分区引入了一种新的优化查询的方式（当然，也有相应的缺点）。优化器可以使用分区函数修整分区，或者把分区从查询中完全移除掉。它通过推断是否可以在特定的分区上找到数据来达成这种优化。因此在最好的情况下，修整可以让查询访问更少的数据。重要的是要在where子句中定义分区键，即使它看上去像是多余的。通过分区键，优化器就可以去掉不用的分区，否则的话，执行引擎就会像合并表那样访问表的所有分区，这在大表上会非常慢。分区数据比非分区数据更好维护，并且可以通过删除分区来移除老的数据。分区数据可以被分布到不同的物理位置，这样服务器可以更有效地使用多个硬盘驱动器。
[z1]分区函数的返回值必须是整数，新增分区的分区函数返回值应大于任何一个现有分区的分区函数的返回值。
[z2]对于有主键的表错误提示：#1503
a primary key must include all columns inthe table's partitioning function，没有主键的则无此约束
[z3]注意：对于通过range分区的表，只可以使用add partition添加新的分区到分区列表的高端。即不能添加比这个分区的范围小的分区。
[z4] 对于按照range分区的表，只能重新组织相邻的分区；不能跳过range分区。不能使用reorganizepartition来改变表的分区类型；也就是说，例如，不能把range分区变为hash分区，反之亦然。也不能使用该命令来改变分区表达式或列。
[z5]注意主键和唯一索引的区别
作者“深巷明朝卖杏花”
bitscn.com

MySQL分区表技术解析_MySQL

推荐信息