MySQL中distinct和group?by去重效率區(qū)別淺析
一、distinct
distinct的作用
在mysql中,distinct關(guān)鍵字的主要作用就是對(duì)數(shù)據(jù)庫(kù)表中一個(gè)或者多個(gè)字段重復(fù)的數(shù)據(jù)進(jìn)行過濾,只返回其中的一條數(shù)據(jù)給用戶,distinct只可以在select中使用
distinct的原理
distinct進(jìn)行去重的主要原理是通過先對(duì)要進(jìn)行去重的數(shù)據(jù)進(jìn)行分組操作,然后從分組后的每組數(shù)據(jù)中去一條返回給客戶端,在這個(gè)分組的過程可能會(huì)出現(xiàn)兩種不同的情況:
distinct 依賴的字段全部包含索引:
該情況mysql直接通過操作索引對(duì)滿足條件的數(shù)據(jù)進(jìn)行分組,然后從分組后的每組數(shù)據(jù)中去一條數(shù)據(jù)。
distinct 依賴的字段未全部包含索引:
該情況由于索引不能滿足整個(gè)去重分組的過程,所以需要用到臨時(shí)表,mysql首先需要將滿足條件的數(shù)據(jù)放到臨時(shí)表中,然后在臨時(shí)表中對(duì)該部分?jǐn)?shù)據(jù)進(jìn)行分組,然后從臨時(shí)表中每個(gè)分組的數(shù)據(jù)中去一條數(shù)據(jù),在臨時(shí)表中進(jìn)行分組的過程中不會(huì)對(duì)數(shù)據(jù)進(jìn)行排序。
distinct的語法:
select distinct expression[,expression…] from tables [where conditions];
在使用distinct的過程中主要注意一下幾點(diǎn):
在對(duì)字段進(jìn)行去重的時(shí)候,要保證distinct在所有字段的最前面
如果distinct關(guān)鍵字后面有多個(gè)字段時(shí),則會(huì)對(duì)多個(gè)字段進(jìn)行組合去重,只有多個(gè)字段組合起來的值是相等的才會(huì)被去重
二、group by
groupby在Mysql8.0之前會(huì)進(jìn)行隱式排序,導(dǎo)致觸發(fā)filesort,sql執(zhí)行效率低下,Mysql8.0開始,Mysql就刪除了隱式排序
隱式排序
對(duì)于隱式排序,我們可以參考Mysql官方的解釋:
MySQL :: MySQL 5.7 Reference Manual :: 8.2.1.14 ORDER BY Optimization
GROUP BY implicitly sorts by default (that is, in the absence of ASC
or DESC designators for GROUP BY columns). However, relying on
implicit GROUP BY sorting (that is, sorting in the absence of ASC or
DESC designators) or explicit sorting for GROUP BY (that is, by using
explicit ASC or DESC designators for GROUP BY columns) is deprecated.
To produce a given sort order, provide an ORDER BY clause.
大致解釋一下:
GROUP BY 默認(rèn)隱式排序(指在 GROUP BY 列沒有 ASC 或 DESC 指示符的情況下也會(huì)進(jìn)行排序)。然而,GROUPBY進(jìn)行顯式或隱式排序已經(jīng)過時(shí)(deprecated)了,要生成給定的排序順序,請(qǐng)?zhí)峁?ORDER BY 子句。
所以,在Mysql8.0之前,Group by會(huì)默認(rèn)根據(jù)作用字段(Groupby的后接字段)對(duì)結(jié)果進(jìn)行排序。在能利用索引的情況下,Group by不需要額外進(jìn)行排序操作;但當(dāng)無法利用索引排序時(shí),Mysql優(yōu)化器就不得不選擇通過使用臨時(shí)表然后再排序的方式來實(shí)現(xiàn)GROUPBY了。且當(dāng)結(jié)果集的大小超出系統(tǒng)設(shè)置臨時(shí)表大小時(shí),Mysql會(huì)將臨時(shí)表數(shù)據(jù)copy到磁盤上面再進(jìn)行操作,語句的執(zhí)行效率會(huì)變得極低。這也是Mysql選擇將此操作(隱式排序)棄用的原因。
基于上述原因,Mysql在8.0時(shí),對(duì)此進(jìn)行了優(yōu)化更新:
MySQL :: MySQL 8.0 Reference Manual :: 8.2.1.16 ORDER BY Optimization
Previously (MySQL 5.7 and lower), GROUP BY sorted implicitly under
certain conditions. In MySQL 8.0, that no longer occurs, so specifying
ORDER BY NULL at the end to suppress implicit sorting (as was done
previously) is no longer necessary. However, query results may differ
from previous MySQL versions. To produce a given sort order, provide
an ORDER BY claus
大致解釋一下:
從前(Mysql5.7版本之前),Group by會(huì)根據(jù)確定的條件進(jìn)行隱式排序。在mysql 8.0中,已經(jīng)移除了這個(gè)功能,所以不再需要通過添加order by null 來禁止隱式排序了,但是,查詢結(jié)果可能與以前的 MySQL 版本不同。要生成給定順序的結(jié)果,請(qǐng)按通過ORDER BY指定需要進(jìn)行排序的字段。
三、distinct 和 group by 比較
在語義相同,有索引的情況下:
group by和distinct都能使用索引,效率相同。因?yàn)間roupby和distinct近乎等價(jià),distinct可以被看做是特殊的group by。
在語義相同,無索引的情況下:
distinct效率高于group by。原因是distinct 和 group by都會(huì)進(jìn)行分組操作,但group
by在Mysql8.0之前會(huì)進(jìn)行隱式排序,導(dǎo)致觸發(fā)filesort,sql執(zhí)行效率低下。
但從Mysql8.0開始,Mysql就刪除了隱式排序,所以,此時(shí)在語義相同,無索引的情況下,groupby和distinct的執(zhí)行效率也是近乎等價(jià)的。
推薦group by的原因:
group by語義更為清晰 group by可對(duì)數(shù)據(jù)進(jìn)行更為復(fù)雜的一些處理 相比于distinct來說,group by的語義明確。且由于distinct關(guān)鍵字會(huì)對(duì)所有字段生效,在進(jìn)行復(fù)合業(yè)務(wù)處理時(shí),group by的使用靈活性更高,groupby能根據(jù)分組情況,對(duì)數(shù)據(jù)進(jìn)行更為復(fù)雜的處理,例如通過having對(duì)數(shù)據(jù)進(jìn)行過濾,或通過聚合函數(shù)對(duì)數(shù)據(jù)進(jìn)行運(yùn)算。
distinct 主要是對(duì)數(shù)據(jù)兩兩進(jìn)行比較,需要遍歷整個(gè)表
group by 是在查詢時(shí)先把數(shù)據(jù)按照分組字段分組出來再查詢,當(dāng)數(shù)據(jù)量較大時(shí),group by 速度要優(yōu)于 distinct
總結(jié)
到此這篇關(guān)于MySQL中distinct和group by去重效率區(qū)別的文章就介紹到這了,更多相關(guān)MySQL distinct和group by去重效率內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
阿里云安裝mysql數(shù)據(jù)庫(kù)出現(xiàn)2002錯(cuò)誤解決辦法
這篇文章主要介紹了阿里云安裝mysql數(shù)據(jù)庫(kù)出現(xiàn)2002錯(cuò)誤解決辦法,需要的朋友可以參考下2017-04-04
CentOS6.5下RPM方式安裝mysql5.6.33的詳細(xì)教程
本文給大家詳細(xì)介紹CentOS6.5下RPM方式安裝mysql5.6.33的教程,本文分步驟給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友一起看看吧2016-10-10
在linux中導(dǎo)入sql文件的方法分享(使用命令行轉(zhuǎn)移mysql數(shù)據(jù)庫(kù))
為使用阿里云主機(jī),沒有裝ftp,也沒有裝phpmyadmin,所以一切都得靠命令行。轉(zhuǎn)移網(wǎng)站的重要一步就是轉(zhuǎn)移數(shù)據(jù)庫(kù),這里簡(jiǎn)單介紹一下如何在這種情況下導(dǎo)入sql文件2014-02-02
分享101個(gè)MySQL調(diào)試與優(yōu)化技巧
隨著越來越多的數(shù)據(jù)庫(kù)驅(qū)動(dòng)的應(yīng)用程序,人們一直在推動(dòng)MySQL發(fā)展到它的極限。這里是101條調(diào)節(jié)和優(yōu)化MySQL安裝的技巧。一些技巧是針對(duì)特定的安裝環(huán)境的,但這些思路是通用的。我已經(jīng)把他們分成幾類,來幫助你掌握更多MySQL的調(diào)節(jié)和優(yōu)化技巧2017-05-05
Scott?數(shù)據(jù)?映射?MySQL代碼實(shí)現(xiàn)分享
這篇文章主要介紹了Scott?數(shù)據(jù)?映射?MySQL,文章圍繞Scott?數(shù)據(jù)?映射?MySQL的相關(guān)代碼分享給大家,具有一定的參考價(jià)值,需要的小伙伴可以參考一下,希望對(duì)你的學(xué)習(xí)有所幫助2022-02-02
Mysql存儲(chǔ)二進(jìn)制對(duì)象數(shù)據(jù)問題
這篇文章主要介紹了Mysql存儲(chǔ)二進(jìn)制對(duì)象數(shù)據(jù)問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-03-03

