MySQL是如何處理排序的(最新推薦)
前言
在MySQL的查詢中常常會用到order by
和group by
這兩個關(guān)鍵字
它們的相同點是都會對字段進行排序,那查詢語句中的排序是如何實現(xiàn)的呢?
當(dāng)使用的查詢語句需要進行排序時有兩種處理情況:
- 當(dāng)前記錄本來就是有序的,不需要進行排序
- 當(dāng)前記錄未保持順序,需要排序
使用索引保證有序
對于第一種情況,常常是使用二級索引中索引列的有序來保證結(jié)果集有序,從而不需要進行排序
對于表a,為a2建立二級索引,那么在二級索引上a2就是有序的
CREATE TABLE `a` ( `a1` int(11) NOT NULL AUTO_INCREMENT, `a2` varchar(255) CHARACTER SET utf8mb4 DEFAULT NULL, `a3` varchar(255) DEFAULT NULL, PRIMARY KEY (`a1`), KEY `idx_a2` (`a2`) ) ENGINE=InnoDB AUTO_INCREMENT=76 DEFAULT CHARSET=utf8;
select * from a order by a.a2 limit 10
當(dāng)優(yōu)化器選擇使用a2索引時,a2列的記錄本身就是有序的,因此不需要再使用其他開銷進行排序
當(dāng)然,優(yōu)化器也有可能不使用a2索引(當(dāng)優(yōu)化器認(rèn)為使用a2回表開銷太大時會使用全表掃描)
當(dāng)優(yōu)化器使用的索引上a2無序時,則會通過其他手段對結(jié)果進行排序
filesort
當(dāng)執(zhí)行計劃的Extra附加信息中出現(xiàn)Using filesort
時,會使用sort_buffer對結(jié)果進行排序
sort_buffer是一塊用于排序的內(nèi)存,sort_buffer可能存放查詢需要的所有字段,也可能只存放需要排序的字段和主鍵
show variables like 'max_length_for_sort_data'
當(dāng)查詢需要的字段長度小于max_length_for_sort_data
時,則會將查詢需要的所有字段放入sort_buffer中,然后對需要排序的列進行排序,最后返回結(jié)果
當(dāng)查詢需要的字段長度大于max_length_for_sort_data
時,只會將需要排序的字段和主鍵值放入sort_buffer中,等到排序后再去查詢聚簇索引獲取需要查詢的列(相當(dāng)于又多了一次回表)
在sort_buffer中進行排序時,如果內(nèi)存足夠則會在內(nèi)存中進行排序,如果內(nèi)存不夠則會使用磁盤的臨時文件來輔助排序
開啟optimizer_trace
可以查看是否使用臨時文件輔助排序
#開啟優(yōu)化器追蹤 SET optimizer_trace='enabled=on'; ? #sql語句 select * from student order by student_name limit 10000; ? #查看優(yōu)化器追蹤的信息 SELECT * FROM `information_schema`.`OPTIMIZER_TRACE`\G;
排序使用的算法是歸并算法,先分割成多個小文件排序再進行合并
其中number_of_tmp_files
為使用到的臨時文件數(shù)量,sort_buffer_size
為sort_buffer大小
因此當(dāng)使用order by、group by等需要排序的關(guān)鍵字時,最好建立合適的索引
如果數(shù)據(jù)量小可以在sort buffer中排序,如果數(shù)據(jù)量太大還需要與磁盤交互
總結(jié)
當(dāng)查詢語句需要排序時會分為不用排序和需要排序兩種情況
當(dāng)使用的索引有序時則不用再進行排序,通過索引來保證有序
當(dāng)使用的索引無序時則會使用sort_buffer進行排序,當(dāng)查詢字段的長度未超過限制時,sort_buffer中每條記錄會存儲需要查詢的列
如果超過限制,則sort_buffer只會存儲需要排序的列和主鍵值,排序后再通過主鍵值進行回表獲取需要查詢的列
當(dāng)數(shù)據(jù)量太大不夠在內(nèi)存中排序完,會使用磁盤頁輔助排序,使用歸并算法將排序數(shù)據(jù)分散在多個頁再合并
可以通過追蹤優(yōu)化器 optimizer_trace 分析內(nèi)容查看輔助頁的數(shù)量等信息
為需要排序的列建立合適的索引,避免使用磁盤頁輔助排序
當(dāng)無法使用索引時可以調(diào)整sort buffer 或 max_length_for_sort_data(謹(jǐn)慎)
到此這篇關(guān)于聊聊MySQL是如何處理排序的的文章就介紹到這了,更多相關(guān)mysql排序內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
MySql使用skip-name-resolve解決外網(wǎng)鏈接客戶端過慢問題
在騰訊云上面搭建的mysql使用開發(fā)的電腦上navicat進行訪問時總是特別的慢,原來是Mysql會對請求的地址進行域名解析,開發(fā)的電腦并沒有域名,所以會導(dǎo)致特別的慢,下面通過本文給大家分享MySql使用skip-name-resolve解決外網(wǎng)鏈接客戶端過慢問題2017-07-07MySQL窗口函數(shù) over(partition by)的用法
本文主要介紹了MySQL窗口函數(shù) over(partition by)的用法, partition by相比較于group by,能夠在保留全部數(shù)據(jù)的基礎(chǔ)上,只對其中某些字段做分組排序,下面就來介紹一下具體用法,感興趣的可以了解一下2024-02-02MySQL數(shù)據(jù)庫中使用REPLACE函數(shù)示例及實際應(yīng)用
本文詳細(xì)介紹了MySQL中的REPLACE函數(shù),包括其基本語法、用法和實際應(yīng)用場景,REPLACE函數(shù)主要用于替換字符串中的某些子字符串,對大小寫敏感,文章還通過多個示例展示了REPLACE函數(shù)的實際應(yīng)用,需要的朋友可以參考下2024-10-10MYSQL數(shù)據(jù)庫如何設(shè)置主從同步
大家好,本篇文章主要講的是MYSQL數(shù)據(jù)庫如何設(shè)置主從同步,感興趣的同學(xué)趕快來看一看吧,對你有幫助的話記得收藏一下2022-01-01Java實現(xiàn)獲得MySQL數(shù)據(jù)庫中所有表的記錄總數(shù)可行方法
可以通過SELECT COUNT(*) FROM table_name查詢某個表中有多少條記錄。本文給出兩種可行的Java程序查詢所有別的記錄方法,感興趣朋友可以了解下2013-06-06