您的位置：首页 > 数据库 > MySQL

mysql使用MRG_MyISAM(MERGE)实现水平分表

2015-11-26 16:13 519 查看

http://m.oschina.net/blog/382658

在MySql中数据的优化尤其是大数据量的优化是一门很大的学问，当然其它数据库也是如此，即使你不是DBA，做为一名程序员掌握一些基本的优化信息，也可以让你在自己的程序开发中受益匪浅。当然数据库的优化有很多的方方面面，本篇主要讲，Mysql的水平分表技术，也可以说是其技术的其中之一。

在使用水平分表时，首先问下自己几个问题。

第一、为什么要水平分表？

第二、什么时候需要水平分表？

第三、怎样实现水平分表？

一、为什么要水平分表？

简而言之，当单表数据量过大时，无法对其进行有效的维护，以及查询速度严重变慢时，我们就需要对其时行水平分表

二、什么时候需要水平分表？

在数据库结构的设计中，需要充分考虑后期数据的增长量和增长速度，如果后期的数据增长量过快，以及后期数据量巨大，就需要使用水平分表。

三、怎样实现水平分表？

其实水平分表的方法，很多，但个人觉得结合程序的增删改查，本篇介绍的方法MRG_MySIAM存储引擎(MERGE存储引擎)个人觉得还是比较简单方便的，虽然性能方面与其它分表技术相比可能不是第一，但就使用程序对其的操控性来说，个人觉得还是很不错的。

MERGE存储引擎基本介绍和使用规范说明【以下截自MySql手册】：

MERGE存储引擎，也被认识为MRG_MyISAM引擎，是一个相同的可以被当作一个来用的MyISAM表的集合。“相同”意味着所有表同样的列和索引信息。你不能合并列被以不同顺序列于其中的表，没有恰好同样列的表，或有不同顺序索引的表。而且，任何或者所有的表可以用myisampack来压缩。表选项的差异，比如AVG_ROW_LENGTH,
MAX_ROWS或PACK_KEYS都不重要。

当你创建一个MERGE表之时，MySQL在磁盘上创建两个文件。文件名以表的名字开始，并且有一个扩展名来指明文件类型。一个.frm文件存储表定义，一个.MRG文件包含被当作一个来用的表的名字。这些表作为MERGE表自身，不必要在同一个数据库中。

你可以对表的集合用SELECT, DELETE, UPDATE和INSERT。你必须对你映射到一个MERGE表的这些表有SELECT, UPDATE和DELETE 的权限。

如果你DROP MERGE表，你仅在移除MERGE规格。底层表没有受影响。

当你创建一个MERGE表之时，你必须指定一个UNION=(list-of-tables)子句，它说明你要把哪些表当作一个来用。如果你想要对MERGE表的插入发生在UNION列表中的第一个或最后一个表上，你可以选择地指定一个INSERT_METHOD选项。使用FIRST或LAST值使得插入被相应地做在第一或最后一个表上。如果你没有指定INSERT_METHOD选项，或你用一个NO值指定该选项。往MERGE表插入记录的试图导致错误。

大致了解了MERGE存储引擎的基本介绍后，就让我们真正开始动手吧。

在分表的我们必须考虑如下问题：

1、根据什么样的规则来实现分表，即通过什么样的规则来插入不同的数据表？

2、即使分表成功，那么程序对其的处理是否简洁？

下面以下实例来说明，

假设我们有个邮件服务器，需要存储很多很多用户的邮件，为了解决后期数据量具大问题，我们就需要使用水平分表技术。

以什么样的规则来实现分表，分表数据如何确定？

首先我们必须大概估算以后的数据量会多大，分多少张表比较合适，从而来确定分表规则。

以我的情况为例，

我觉得以邮件的发送时间来计算，按天来划分，分为31张表比较合适。

那么我的分表规则，则如下设计，：

email为主表，email_X为子表，先创建子表，结构与主表相同，在创建子表时注意要将ENGINE=MRG_MyISAM替换为ENGINE=MyISAM，否则会出现Unable to open underlying table which is differently defined or of non-MyISAM type or doesn't exist的错误提示，不能对主表进行查询

CREATE TABLE `email` (
`id` int(10) unsigned NOT NULL AUTO_INCREMENT,
`euid` mediumint(8) unsigned NOT NULL DEFAULT '0' COMMENT '帐号ID',
`uid` char(50) NOT NULL COMMENT '邮件UID',
`reciever` char(255) NOT NULL COMMENT '收件人',
`sender` char(255) NOT NULL COMMENT '发送人',
`sendTime` int(10) unsigned NOT NULL DEFAULT '0',
`sendTitle` char(100) NOT NULL COMMENT '主题 ',
`type` char(50) NOT NULL COMMENT '类型',
PRIMARY KEY (`id`)
) ENGINE=MRG_MyISAM
DEFAULT CHARSET=utf8
UNION=(`email_1`,`email_2`,`email_3`,`email_4`,`email_5`,`email_6`,`email_7`,`email_8`,`email_9`,`email_10`,`email_11`,`email_12`,`email_13`,`email_14`,`email_15`,`email_16`,`email_17`,`email_18`,`email_19`,`email_20`,`email_21`,`email_22`,`email_23`,`email_24`,`email_25`,`email_26`,`email_27`,`email_28`,`email_29`,`email_30`,`email_31`);

首先创建一张MERGE存储类型的主表，

然后再批量创建31张MyISAM存储类型的数据表。

OK，此时创建完成后，我们需要做的是什么？

当然，第一步肯定是写入数据。此时我们的分表规则就有了用武之地了。

$sql = "INSERT INTO email_{$ruleNum}(....) VALUES(.....);"

此时完全可以正确的写入，并且在Email表中也会存在，是不是很OK。

但别高兴太早，我们要做的远远不止这些。

首先，因为ID是Auto_Increment,你完全可以不用管，因为每次插入不同的数据表都会有不同的ID,但问题是当你在EMAil这个Merge类型表中查看时你会发现，会有很多重复的ID，因为每张表的ID在email表中展现可能会有大量重复。这对我们修改和删除会有极大的影响，如果没有惟的ID，默认修改是根据排序来分别的，当然不可以。

所以在数据写入时，我们必须还要手动增加ID，来保证整个数据的ID都是惟一的。

方法当然有很多种，简单介绍下我的做法，

我直接新建了一张表就一个字段：

在每次新增完成数据后，都会使用触发器自动将此表中的数据值+1，而在每次读取时，先读取此表，获取下一个ID，这样就能保证数据ID永远惟一。

PS:也可以将此ID值存入文件，前提是在不会丢失的情况下。或其它都OK。

写入问题解决后，就剩下UPDATE,DELETE,SELECT了，这些现在都已不是问题，我们直接操作Email这个Merge类型表即可，（Mysql手册也有详细的介绍，可自行查看）

INSERT：

SELECT * FROM eamil where ($where) limit 20,10;

UPDATE:

UPDATE email SET username='$username' WHERE id=10

DELETE：

DELETE FROM email WHERE id=11

这只是一种MySql的水平分表方法，如果数据表较少的话，也可以使用

union 联合查询来实现数据表分表联合查询。

其它方法，网上也有很多，可自行查看。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航