好得很程序员自学网

<tfoot draggable='sEl'></tfoot>

mysql集群采用磁盘文件存储表

MySQLCluster5.1 的一个最受期待的特性是集群已支持基于磁盘的数据存

MySQL Cluster 5.1 的一个最受期待的特性是集群已支持基于磁盘的数据存取。 NDB 存储引擎大大增强了 MySQL Cluster 的性能,该引擎之前是一个 100 %的内存数据库引擎。这种引擎对可以运行在内存里的数据库来说是极好的选择,现在基于磁盘的存取数据支持使 MySQL 5.1 集群拓展了数据库规模,使 MySQL 集群用户有能力创建更大的数据库而且能对其有效的管理。

对于必须具备很高可用性,但不苛求像基于内存数据存储那样的高性能特性的数据,利用磁盘存取的方式将是最好的选择。另外,那些由于操作系统或硬件条件所致的硬性局限,可以考虑移植基于内存存取的库到磁盘存取的库当中,或者在支持磁盘存取数据的 MySQL Cluster 上开发新的应用。

本文主要关注MySQL Cluster 中创建、移植和维护基于磁盘存取的数据表。请切记对基于磁盘存取数据的支持已经在 5.1.6bata 版中正式推出。

1. 概念

MySQL Cluster 采用一系列的 Disk Data objects 来实现磁盘表。
Tablespaces :作用是作为其他 Disk Data objects 的容器。
Undo log files :存储事务进行回滚需要的信息,一个或者多个 undo log files 组成一个 log files group ,最后,该 log file group 关联到一个 tablespaces 。
Data files :作用是存储表中的数据, data file 直接关联到 tablespaces 。
在每一个数据节点上 undo log files 和 data files 都是实际的文件,默认的,存放在 ndb_node_id_fs 文件夹下,该路径是在 MySQL Cluster 的 config.ini中 用 DataDir 指定的, node_id 是 data node 的 node ID 。可以用绝对路径或者相对路径指定 undo log 或者 data file 的路径。 tablespaces 和 log file group 则不是实际的文件。

2. 创建步骤

MySQL Cluster 创建一个磁盘表需要包含以下几步:
1 、 创建一个 log file group ,将一个或者多个 undo log files 关联到它上面 (undo log file 也叫做 undofile) 。注意, undo log file 只是在创建磁盘表的时候才需要,创建 ndb 的内存表的时候不需要。

2 、 创建一个 tablespaces ,关联一个 log file group 和一个或者多个 data files 到上面。

3 、 使用该 tablespaces 创建一个磁盘表存储数据。

下面做一个例子 , 创建一个基于内存存取的表

通常创建 NDB 表的时候,只要发出如下的语句,表和索引都会在主存里建立起来,并且已处于就绪状态。

CREATE TABLE table1 (
col1 int, 
col2 int, 
col3 int, 
col4 int,
PRIMARY KEY(col1), 
index(col1,col2)) ENGINE=ndb;   

上面语句所建表的属性如下:

col1 和 col2 列驻留内存,因为它们是索引的一部分,这一点即使在使用基于磁盘的存储的 MySQL 5.1 里面也有同样的限制,原因是 NDB 索引仍然必须全部驻留于内存里 。

Col3列和 col4 列也驻留 于内存,不过我们在 5.1 里面可以改成磁盘存储,通过在 MySQL Cluster 定义一个表空间,然后把这些列指向表空间实现。

创建一个日志文件组和表空间

如前所述,利用 MySQL Cluster 的磁盘数据存取新特性时,我们首先进行一些初始步骤准备。这些步骤包括创建日志文件组和表空间。

创建日志文件组时会在每个数据节点上为存储 UNDO 日志而新建一个文件。(请注意在 5.1 版中,只能支持一个 logfile 组,然而,从理论上讲,以后一个无限制 undofiles 数量的特性将被支持的。 Undo 缓冲区的缺省值是 8MB 。)

CREATE LOGFILE GROUP logfg1 ADD UNDOFILE 'undofile1.dat' 
INITIAL_SIZE 16M UNDO_BUFFER_SIZE = 1M ENGINE=ndb;   

该语句可能会出错,出现 ERROR 1064 (42000) 语法错误的信息,原因是字符集的问题,先执行 set character_set_client=latin1 , 在执行 创建 LOGFILE语句。

接下来我们将在每个数据节点上创建一个文件来存储基于磁盘存取表的分区。我们在表空间里面建的表都与一个 logfile 组相关联。

CREATE TABLESPACE tsp1 ADD DATAFILE 'datafile1.dat' USE 
LOGFILE GROUP logfg1 INITIAL_SIZE 12M  ENGINE=ndb; 

由于我们已经创建了 logfile 组和表空间,现在就可以创建第一个基于磁盘存取的表了。

CREATE TABLE table3 (
pk_col1 int, 
fname_col2 VARCHAR(24), 
lname_col3 VARCHAR(255), 
ssno_col4 int , 
PRIMARY KEY (pk_col1), 
INDEX (pk_col1, ssno_col4))
TABLESPACE tsp1 STORAGE DISK ENGINE=ndb; 

上面所建表的属性如下:

pk_col1列和 ssnp_col4 列被保存到内存,因为它们是索引的一部分,这一点前面已有所述,这是源于整个 5.1 版本 MySQL 其索引必须存于内存中。

fname_col2 列和 lname_col3 列不属于索引,将被保存到磁盘上 。

3. 磁盘数据管理与维护

如果以后某一时候需要给表空间增加数据文件,我们可以用下面的命令完成:

ALTER TABLESPACE tsp1 ADD DATAFILE 'datafile2.dat' INITIAL_SIZE 16M ENGINE=ndb; 

添加另一个 undofile 到 logfile 组可以通过下面的方法来做:

ALTER LOGFILE GROUP logfg1 ADD UNDOFILE 'undofile2.dat' 
INITIAL_SIZE 16M ENGINE=ndb;   

你也可以给在磁盘上建好的表添加一个索引,具体过程如下:

CREATE TABLE table3 (
col1 int, 
col2 int, 
col3 int, 
col4 int, 
PRIMARY KEY (col1))  
TABLESPACE tsp1 STORAGE DISK ENGINE=ndb;  
ALTER TABLE table3 ADD INDEX col1and2_index (col1, col2), ENGINE=ndb; 

这两步操作将创建适当的索引,并将相应的索引列移到内存,而把其他的,列存于磁盘上。

可以在 INFORMATION_SCHEMA 数据库中的 FILES 表中查看磁盘表的信息。

SELECT
TABLE_NAME,
`ENGINE`,
TABLE_ROWS,
AVG_ROW_LENGTH,
DATA_LENGTH,
MAX_DATA_LENGTH,
INDEX_LENGTH,
DATA_FREE
FROM
TABLES
WHERE
TABLE_NAME LIKE 'disktabl%'; 

从上面的截图中看出,测试用了两张表,一张是 diskTableInDisk 表,存储数据在磁盘上,一张是 diskTableInMemory 表,存数数据在内存中,两张表的结构完全一样,只是表名称不一样,向两张表中插入 8000 条相同的数据,内存表占用了大约 3.2M 的内存空间,磁盘表占用了大约 1.5M 的内存空间,但是磁盘表还占用了 20 多兆的磁盘空间。磁盘数据表占用磁盘空间大。

关于表空间和 logfile 组方面需要注意的是,在表空间和 logfile 组被删除之前,必须先删除表空间和 logfile 组中的对象。否则将产生与下面相似的结果:

DROP TABLESPACE tsp1 ENGINE=ndb;  
ERROR 1507 (HY000): Failed to drop TABLESPACE  DROP LOGFILE GROUP logfg1 ENGINE=ndb;  ERROR 1507 (HY000): Failed to drop LOGFILE GROUP  

对基于磁盘的集群结构的管理可以简要概括如下:

1 、 如果相依赖的表空间存在则 logfile 组不能被删除

2 、 如果相依赖的数据文件存在则表空间不能被删除

3 、 如果表空间中相依赖的表存在,则相应的数据文件就不能从表空间中删除。

因此,在开始上述维护操作之前,我们必须先使用如下命令删除数据表。

DROP TABLE table3;

然后删除和表空间相关联的数据文件。

ALTER TABLESPACE tsp1 DROP DATAFILE 'datafile1.dat' ENGINE=ndb;      
ALTER TABLESPACE tsp1 DROP DATAFILE 'datafile2.dat' ENGINE=ndb;  

最后删除表空间和 logfile 组

DROP TABLESPACE tsp1 ENGINE=ndb; 
DROP LOGFILE GROUP logfg1 ENGINE=ndb;  

4. 移植内存表到磁盘表

现在我们来看怎么移植一个内存表到一个磁盘表,首先,我们先创建一个简单的内存表:

CREATE TABLE table4 (
col1 int(5), 
col2 int(5), 
col3 int(5), 
col4 int(5), 
PRIMARY KEY(col1), 
INDEX(col1,col2)) ENGINE=ndb; 

所建表的属性如下:

col1 和 col2 列由于是索引,被保存到内存。

col3 和 col4 列因为没有定义与之对应的表空间,因此也被保存于内存中。

如前所述,存于磁盘的数据需要有一个表空间和 logfile 组,因而先来创建这两项:

CREATE LOGFILE GROUP logfg1 ADD UNDOFILE 'undofile1.dat' INITIAL_SIZE 16M  UNDO_BUFFER_SIZE = 1M ENGINE=ndb;
CREATE TABLESPACE tsp1 ADD DATAFILE 'datafile1.dat' USE LOGFILE GROUP logfg1 INITIAL_SIZE 12M ENGINE ndb;  

现在,执行下面的 ALTER 命令来移植内存表到利用上面定义的表空间的磁盘表。

ALTER TABLE table4 TABLESPACE tsp1 STORAGE DISK ENGINE=ndb;  

移植后的表属性如下:

col1 和 col2 列被保存于内存中,因为他们仍是索引的一部分。

col3 和 col4 列将被保存到磁盘,因为他们不属于索引。

参数

以下是当使用基于磁盘的数据时,你应该添加到集群配置文件 config.ini 的 NDBD 部分的一些参数。

DiskPageBufferMemory= X

这个参数定义磁盘数据页缓存大小,每一页分配 32K bytes 。

SharedPoolMemory= X

这个参数设定能被各种资源所使用的空间大小,目前使用共享池的对象包括:表空间、logfile 组 、数据文件、undo文件、分区信息、log buffer waiter、log sync waiter、页请求、undo 缓冲 。

5. 磁盘数据存取的注意点

1) 磁盘数据表的变长列将占用固定空间,对于每行来说,也就是占用最大空间。

2) 在磁盘数据表中, TEXT 和 BLOB 的前 256 个字节存于内存,其他的存放在磁盘上。

3) 磁盘数据表的每一行要在内存里面存放 8 个字节,以指向存放在磁盘上的数据。所以如果一行要存放在磁盘上数据少于 8 个字节,还不如都放在内存里。

4) 数据节点重启时 --initial 选项并不移除磁盘数据文件,你得手工事先把他们干掉。

5) 在每个 CREATE LOGFILE GROUP 、 ALTER LOGFILE GROUP 、 CREATE TABLESPACE or ALTER TABLESPACE 语句里面都必须加上一个 ENGINE 字段, ENGINE 的值可以为 NDB 和 NDBCLUSTER 。

参考

http://wenku.baidu.com/link?url=be8N19vKcJG6tNpPy96v5G2CoiLwKnu8Bmzz2-0xUEyPXTTJP1eVJPj6hVSVrJ6UN3m61i1WZLjNJwvfHoi7kQS9uT63gI7Q9Vbl2BnRYUi

http://www.gxlcms.com/article/31874.htm

http://blog.csdn.net/mchdba/article/details/10544585

http://blog.csdn.net/chenxingzhen001/article/details/7592100

查看更多关于mysql集群采用磁盘文件存储表的详细内容...

  阅读:62次