腳本之家服務器常用軟件

快捷導航

MySQL批量插入遇上唯一索引避免方法

更新時間：2013年01月04日 15:25:35 作者：

以前使用SQL Server進行表分區(qū)的時候就碰到很多關于唯一索引的問題,今天我們來了解MySQL唯一索引的一些知識：包括如何創(chuàng)建，如何批量插入，還有一些技巧上SQL,感興趣的朋友可以了解下

一、背景

以前使用SQL Server進行表分區(qū)的時候就碰到很多關于唯一索引的問題：Step8：SQL Server 當表分區(qū)遇上唯一約束，沒想到在MySQL的分區(qū)中一樣會遇到這樣的問題：MySQL表分區(qū)實戰(zhàn)。

今天我們來了解MySQL唯一索引的一些知識：包括如何創(chuàng)建，如何批量插入，還有一些技巧上SQL；

這些問題的根源在什么地方？有什么共同點？MySQL中也有分區(qū)對齊的概念？唯一索引是在很多系統(tǒng)中都會出現(xiàn)的要求，有什么辦法可以避免？它對性能的影響有多大？

二、過程

(一) 導入差異數(shù)據(jù)，忽略重復數(shù)據(jù)，IGNORE INTO的使用

在MySQL創(chuàng)建表的時候，我們通常創(chuàng)建一個表的時候是以一個自增ID值作為主鍵，那么MySQL就會以PRIMARY KEY作為聚集索引鍵和主鍵，既然是主鍵，那當然是唯一的了，所以重復執(zhí)行下面的插入語句會報1062錯誤：如Figure1所示；

復制代碼代碼如下:

-- 創(chuàng)建測試表 
CREATE TABLE `testtable` ( 
`Id` INT(11) UNSIGNED NOT NULL AUTO_INCREMENT, 
`UserId` INT(11) DEFAULT NULL, 
`UserName` VARCHAR(10) DEFAULT NULL, 
`UserType` INT(11) DEFAULT NULL, 
PRIMARY KEY (`Id`) 
) ENGINE=INNODB DEFAULT CHARSET=utf8; 

-- 插入測試數(shù)據(jù) 
INSERT INTO testtable(Id,UserId,UserName,UserType) 
VALUES(1,101,'aa',1),(2,102,'bbb',2),(3,103,'ccc',3);

u1_1062

（Figure1：Duplicate entry '1' for key 'PRIMARY'）

但是在實際的生產環(huán)境中，需求往往是需要在UserId鍵值中設置唯一索引，今天我就以這個作為示例，進行唯一索引的測試：

復制代碼代碼如下:

-- 創(chuàng)建測試表1 
CREATE TABLE `testtable1` ( 
`Id` INT(11) UNSIGNED NOT NULL AUTO_INCREMENT, 
`UserId` INT(11) DEFAULT NULL, 
`UserName` VARCHAR(10) DEFAULT NULL, 
`UserType` INT(11) DEFAULT NULL, 
PRIMARY KEY (`Id`), 
UNIQUE KEY `IX_UserId` (`UserId`) 
) ENGINE=INNODB DEFAULT CHARSET=utf8; 

-- 創(chuàng)建測試表2 
CREATE TABLE `testtable2` ( 
`Id` INT(11) UNSIGNED NOT NULL AUTO_INCREMENT, 
`UserId` INT(11) DEFAULT NULL, 
`UserName` VARCHAR(10) DEFAULT NULL, 
`UserType` INT(11) DEFAULT NULL, 
PRIMARY KEY (`Id`), 
UNIQUE KEY `IX_UserId` (`UserId`) 
) ENGINE=INNODB DEFAULT CHARSET=utf8; 

-- 插入測試數(shù)據(jù)1 
INSERT INTO testtable1(Id,UserId,UserName,UserType) 
VALUES(1,101,'aa',1),(2,102,'bbb',2),(3,103,'ccc',3); 

-- 插入測試數(shù)據(jù)2 
INSERT INTO testtable2(Id,UserId,UserName,UserType) 
VALUES(1,201,'aaa',1),(2,202,'bbb',2),(3,203,'ccc',3),(4,101,'xxxx',5);

u2_table1

（Figure2：testtable1記錄）

u3_table2

（Figure3：testtable2記錄）

通過執(zhí)行上面的SQL腳本，我們在testtable1和testtable2都創(chuàng)建了唯一索引：UNIQUE KEY `IX_UserId` (`UserId`)，這就說明UserId在testtable1和testtable2表中都是唯一的，如果把testtable2的數(shù)據(jù)批量導入到testtable1，如果執(zhí)行下面【導入1】的SQL，就會出現(xiàn)1062的錯誤，導致整個過程會回滾，沒有達到導入差異數(shù)據(jù)的目的。

復制代碼代碼如下:

INSERT INTO testtable1(UserId,UserName,UserType) 
SELECT UserId,UserName,UserType FROM testtable2;

u4_unique

（Figure4：Duplicate entry '101' for key 'IX_UserId'）

MySQL提供一個關鍵字：IGNORE，這個關鍵字判斷每條記錄是否存在，是否違反餓了表中的唯一索引，如果存在就不插入，而不存在的記錄就會插入。

復制代碼代碼如下:

-- 導入2 
INSERT IGNORE INTO testtable1(UserId,UserName,UserType) 
SELECT UserId,UserName,UserType FROM testtable2;

所以執(zhí)行完【導入2】，就會產生Figure5的結果，這已經達到了我們的目的了，但是你有沒發(fā)現(xiàn)自增的ID值跳過了一些值，這是因為我們之前執(zhí)行【導入1】失敗造成的，雖然我們的事務回滾了，但是自增ID會出現(xiàn)斷層。在SQL Server中也會有這樣的問題。擴展閱讀：簡單實用SQL腳本Part：查找SQL Server 自增ID值不連續(xù)記錄

u5_效果

（Figure5：IGNORE效果）

(二) 導入并覆蓋重復數(shù)據(jù)，REPLACE INTO 的使用

1. 把testtable1和testtable2分別回滾到Figure2和Figure3的狀態(tài)（使用TRUNCATE TABLE命名再執(zhí)行Insert語句），這個時候再執(zhí)行下面的SQL，看有什么效果：

復制代碼代碼如下:

-- 導入3 
REPLACE INTO testtable1(UserId,UserName) 
SELECT UserId,UserName FROM testtable2;

（Figure6：REPLACE效果）

從上圖Figure6中，我們可以看到：UserId為101的記錄發(fā)生了改變，不單UserName修改了，而且UserType也變?yōu)镹ULL了。

所以，如果導入中發(fā)現(xiàn)了重復的，先刪除再插入，如果記錄有多個字段，在插入的時候如果有的字段沒有賦值，那么新插入的記錄這些字段為空（新插入記錄的UserType都為NULL）。

需要注意的是，當你replace的時候，如果被插入的表如果沒有指定列，會用NULL表示，而不是這個表原來的內容。如果插入的內容列和被插入的表列一樣，則不會出現(xiàn)NULL。

2. 如果我們表結構UserType字段不允許為空，而且沒有默認值的情況，執(zhí)行【導入3】會發(fā)生什么事情呢？

u7_not null

（Figure7：返回警告信息）

u8_0

（Figure8：UserType被設置為0）

通過Figure7和Figure8，我們知道數(shù)據(jù)記錄還是插入了，只是返回Field 'UserType' doesn't have a default value的警告，插入記錄的UserType字段都被設置為0（'UserType' 為int數(shù)據(jù)類型）。

3. 如果我們希望導入的時候一起更新UserType字段的值，這自然很簡單了，使用下面的SQL腳本就可以解決：

復制代碼代碼如下:

-- 導入4 
REPLACE INTO testtable1(UserId,UserName,UserType) 
SELECT UserId,UserName,UserType FROM testtable2;

u9_rep

（Figure9：一起更新UserType）

(三) 導入保留重復數(shù)據(jù)未指定字段，INSERT INTO ON DUPLICATE KEY UPDATE 的使用

把testtable1和testtable2分別回滾到Figure2和Figure3的狀態(tài)（使用TRUNCATE TABLE命名再執(zhí)行Insert語句），這個時候再執(zhí)行下面的SQL，看有什么效果：

復制代碼代碼如下:

-- 導入5 
INSERT INTO testtable1(UserId,UserName) 
SELECT UserId,UserName FROM testtable2 
ON DUPLICATE KEY UPDATE 
testtable1.UserName = testtable2.UserName;

u10_update

（Figure10：保留UserType值）

對比Figure2、Figure3與Figure10，UserId為101的記錄：更新了UserName的值，保留了UserType的值；但是由于【導入5】中沒有指定UserType，所以新插入記錄的UserType是為NULL的。

復制代碼代碼如下:

-- 導入6 
INSERT INTO testtable1(UserId,UserName,UserType) 
SELECT UserId,UserName,UserType FROM testtable2 
ON DUPLICATE KEY UPDATE 
testtable1.UserName = testtable2.UserName;

u11_update