MySQL COUNT函數(shù)的使用與優(yōu)化
COUNT 函數(shù)做什么用?
COUNT 是一個專用的函數(shù),通常有兩種不同的方式:計算值和數(shù)據(jù)行。值指的是非空(Non-NULL)表達式(NULL表示值缺失)。如果我們在 COUNT的參數(shù)中指定了列名或其他表達式,則 COUNT 函數(shù)是計算該表達式擁有值的次數(shù)。這讓很多人困惑,相當一部分的原因是值和 NULL 的概念是模糊的。
另一種 COUNT 的形式是簡單地計算結果集的數(shù)據(jù)行數(shù)。這是在 MySQL 知道 COUNT 函數(shù)參數(shù)的表達式不可能為 NULL 時的計算方式。最為典型的例子是 COUNT(*),你也許會以為這是展開數(shù)據(jù)表的全部列的一種替代形式。事實上,它會忽略了全部列而僅僅對數(shù)據(jù)行數(shù)進行記數(shù)。
一個經常犯的錯誤是我們在 COUNT 的參數(shù)里指定了列名然后以為是對數(shù)據(jù)行進行計數(shù)。如果你是想獲取結果中的行數(shù),你應該一直使用 COUNT(*),這會使得你的查詢語句意圖更明確并且可以避免性能問題。
MyISAM 的“神奇”之處
一個常見的誤解是 MyISAM 對于 COUNT 查詢來說會非常快。MyISAM 的 COUNT 查詢確實快,但這種快的場景十分有限:COUNT()查詢并且沒有 WHERE 條件時才能達到這樣的效果,而實際這種場景很少見。MySQL 能夠對這個語句進行優(yōu)化的原因是存儲引擎總是知道數(shù)據(jù)表的準確行數(shù)。如果 MySQL 知道一個列col不可能為 NULL,它也會將 COUNT(col) 轉換為 COUNT()來進行優(yōu)化。
MyISAM在 COUNT 查詢中有 WHERE條件、或其他對值進行計數(shù)時 并沒有“神奇”之處。相比其他存儲引擎可能快也可能慢,這取決于很多其他因素。
簡單的COUNT優(yōu)化
當你想要對數(shù)據(jù)行的索引覆蓋不高的情況,又需要統(tǒng)計所有行數(shù)量時可以采用 MyISAM 引擎的 COUNT(*)來進行優(yōu)化。下面的例子使用了標準的世界數(shù)據(jù)庫去展示查找 ID 大于5的城市數(shù)量時的優(yōu)化力度,你寫出的SQL 語句可能如下所示:
SELECT COUNT(*) FROM world.City WHERE ID > 5;
如果使用 SHOW STATUS 檢查查詢的話會發(fā)現(xiàn)掃描了4079行。而如果是采用負向條件查詢,并且減去那些 ID 小于等于5的城市數(shù)量的話,你會發(fā)現(xiàn)可以將掃描結果減少到5行。
SELECT (SELECT COUNT(*) FROM world.City) - COUNT(*) FROM world.City WHERE ID <= 5;
這個查詢會讀取更少的行是因為在查詢優(yōu)化階段將查詢轉換為了常量,使用 EXPLAIN 可以看到:
id | select_type | table | rows | Extra |
---|---|---|---|---|
1 | PRIMARY | City | 6 | Using where; Using index |
2 | SUBQUERY | NULL | NULL | Select tables optimized way |
一個常見的問題是如何在一個查詢語句中完成對同一列的不同值的數(shù)量的查詢。例如,你想通過一條查詢語句查出不同顏色對應的數(shù)量。你不能使用諸如 SELECT COUNT(color = 'blue' OR color='red') FROM items來完成查詢,因為這樣不會區(qū)分出不同顏色相應的數(shù)量。而你也不能將顏色放入 WHERE 條件中,例如 SELECT COUNT(*) FROM items WHERE color = 'blue' AND color = 'red'由于顏色本身是互斥的,因此可以用下面的方法解決這一問題:
SELECT SUM(IF(color = 'blue', 1, 0)) AS blue, SUM(IF(color = 'red', 1, 0)) as red FROM items;
還有一種變通的形式是不是要 SUM,而是 COUNT,只是保證了沒有值的表達式的判決表達式是 false:
SELECT COUNT(color = 'blue' OR NULL) as blue, COUNT(color = 'red' OR NULL) as red FROM items;
使用近似值
有時候并不需要精確的數(shù)量,這個時候就可以使用近似值。在 EXPLAIN優(yōu)化器中給出的估計行數(shù)通常可以滿足這種場景,此時可以使用 EXPLAIN 來替代真實的查詢。
在很多情況下,一個準確的數(shù)量與近似值相比低效很多。一個客戶曾經要求統(tǒng)計他們網(wǎng)站的活躍用戶數(shù)量。用戶數(shù)量被緩存并每隔30分鐘更新一次。這本身就不準確,因此使用估計值是可以接受的。這個查詢使用了多個 WHERE 條件去保證不會統(tǒng)計非活躍用戶或默認用戶(擁有特殊的 ID)。移除這些條件,并稍微修改一下 count 操作就可以變得更高效。一個更進一步的優(yōu)化是移除不必要的 DISTINCT 操作,從而移除掉一次 filesort 操作。優(yōu)化后的查詢速度更快,且返回了幾乎準確的結果。
更復雜的優(yōu)化
通常來說,COUNT查詢很難優(yōu)化,這是因為它通常需要統(tǒng)計很多行(訪問很多數(shù)據(jù)),在 MySQL 中其他可選的辦法是使用覆蓋索引。如果那還不夠的話,可能需要對整個系統(tǒng)應用架構進行調整了。例如考慮統(tǒng)計數(shù)據(jù)表,或者使用外部的緩存系統(tǒng)(如 Memcached)。我們往往會面臨一個類似的兩難問題:快速、準確和簡單——你只能從中選擇兩項!
以上就是MySQL COUNT函數(shù)的使用與優(yōu)化的詳細內容,更多關于MySQL COUNT的使用與優(yōu)化的資料請關注腳本之家其它相關文章!
相關文章
MySQL 8.0.13設置日期為0000-00-00 00:00:00時出現(xiàn)的問題解決
這篇文章主要介紹了MySQL 8.0.13設置日期為0000-00-00 00:00:00時出現(xiàn)的問題解決,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2019-01-01MySql批量插入優(yōu)化Sql執(zhí)行效率實例詳解
這篇文章主要介紹了MySql批量插入優(yōu)化Sql執(zhí)行效率實例詳解的相關資料,需要的朋友可以參考下2017-04-04