按日期对非常大的表进行分区-MySQL

Rob*_*Rob 2 mysql sql database mysql-workbench

我想在MySQL的日期格式列上创建一个带有分区的表,并希望每次添加额外的日期(每天)时都更新该分区。

最好的方法是什么?为此使用的代码是什么?

提前致谢

IGG*_*GGt 5

如果我们举一个简单的例子:

CREATE TABLE `test`.`NewTable` (
 `id` INT NOT NULL AUTO_INCREMENT,
 `created` DATETIME NULL,
 PRIMARY KEY (`id`,`created`)
);

ALTER TABLE `test`.`NewTable`
PARTITION BY RANGE (TO_DAYS(`Created`)) (
 PARTITION `20150531` VALUES LESS THAN (TO_DAYS('2015-06-01 00:00:00')),
 PARTITION `20150601` VALUES LESS THAN (TO_DAYS('2015-06-02 00:00:00')),
 PARTITION `20150602` VALUES LESS THAN MAXVALUE
);
Run Code Online (Sandbox Code Playgroud)

这为您提供了具有三个分区的表:

20150531= 6月1日之前的所有[OLD]数据
20150601= 6月1日之后的所有数据= 6月1日之后的
20150602所有[FUTURE]数据(或带有错误的未来时间戳记)

在6月2日开始时,您要创建一个新分区,该分区将保存6月2日的所有数据。为此,您需要将20150602分区分为两个分区。

20150602对于6月2日
20150603之后的所有数据,对于6月2日之后的所有[FUTURE]数据(或具有不正确的未来时间戳记)

这是通过以下方式完成的:

ALTER TABLE `test`.`NewTable` 
REORGANIZE PARTITION 20150602 INTO (
 PARTITION 20150602 VALUES LESS THAN (TO_DAYS('2015-06-03 00:00:00')),  
 PARTITION 20150603 VALUES LESS THAN MAXVALUE
); 
Run Code Online (Sandbox Code Playgroud)

这样,您就可以使用:

SELECT MAX(PARTITION_NAME) FROM INFORMATION_SCHEMA.partitions
WHERE TABLE_SCHEMA = 'test' 
AND TABLE_NAME = 'NewTable';
Run Code Online (Sandbox Code Playgroud)

获得FUTURE分区,然后从那里直接确定下一个分区是什么。

我为此使用的事件:

DROP EVENT AddNewPartition_daily;
DELIMITER $$
CREATE EVENT AddNewPartition_daily
ON SCHEDULE
EVERY 1 DAY STARTS CONCAT(DATE_SUB(CURDATE(), INTERVAL -1 DAY),' 00:00:01')
ON COMPLETION PRESERVE
COMMENT 'Adds a New Partition to the Top, and Removes the Oldest Partition From NewTable'
DO
BEGIN
SET @MinP := (SELECT DATE_FORMAT(DATE_SUB(CURDATE(), INTERVAL 9 DAY),'%Y%m%d'));
SET @MaxP := (SELECT MAX(PARTITION_NAME) FROM INFORMATION_SCHEMA.PARTITIONS WHERE TABLE_SCHEMA = 'test' AND TABLE_NAME = 'NewTable');

SET @Today := (SELECT CONCAT(CURDATE(),' 00:00:00'));
SET @Tomorrow := (SELECT CONCAT(DATE_SUB(CURDATE(), INTERVAL -1 DAY),' 00:00:00'));

SET @TodP := (SELECT DATE_FORMAT(CURDATE(),'%Y%m%d'));
SET @TomP := (SELECT DATE_FORMAT(DATE_SUB(CURDATE(), INTERVAL -1 DAY),'%Y%m%d'));

#ADD NEW PARTITION TO TOP
SET  @SQL1 := CONCAT('
ALTER TABLE test.NewTable
REORGANIZE PARTITION `',@TodP,'` INTO
(
    PARTITION `',@TodP,'` VALUES LESS THAN (TO_DAYS(\'',@Tomorrow,'\')),
    PARTITION `',@TomP,'` VALUES LESS THAN MAXVALUE
)');

     PREPARE stmt FROM @SQL1;
     EXECUTE stmt;
     DEALLOCATE PREPARE stmt;

#REMOVE OLDEST PARTITION
SET @SQL2 := CONCAT('ALTER TABLE test.NewTable DROP PARTITION `',@MinP,'`');  

PREPARE stmt FROM @SQL2;
EXECUTE stmt;
DEALLOCATE PREPARE stmt;

END $$
DELIMITER ;
Run Code Online (Sandbox Code Playgroud)

您应该注意,如果您只是连续添加分区而不删除分区,最终将对性能造成影响