快捷導(dǎo)航

Mysql分組查詢每組最新的一條數(shù)據(jù)的五種實(shí)現(xiàn)方法

更新時間：2024年08月04日 09:32:10 作者：kerwin_code

在寫報表功能時遇到一個需要根據(jù)用戶id分組查詢最新一條錢包明細(xì)數(shù)據(jù)的需求,本文主要介紹了Mysql分組查詢每組最新的一條數(shù)據(jù)的五種實(shí)現(xiàn)方法,感興趣的可以了解一下

前言
注意事項(xiàng)
準(zhǔn)備SQL
錯誤查詢
方法一
方法二（適用于自增ID和創(chuàng)建時間排序一致）
方法三（適用于自增ID和創(chuàng)建時間排序一致，查詢性能最優(yōu)）
方法四（通過DISTINCT關(guān)鍵字打破MySQL語句優(yōu)化使排序生效）
方法五（以創(chuàng)建時間為基準(zhǔn)獲取每個用戶最新的一條數(shù)據(jù)，必須要添加對應(yīng)字段的索引最好是覆蓋索引）
總結(jié)

MAX()函數(shù)和MIN()這一類函數(shù)和GROUP BY配合使用存在問題

前言

在寫報表功能時遇到一個需要根據(jù)用戶id分組查詢最新一條錢包明細(xì)數(shù)據(jù)的需求，在寫sql測試時遇到一個有趣的問題，開始使用子查詢根據(jù)時間倒序+group by customer_id發(fā)現(xiàn)查詢出來的數(shù)據(jù)一直都是最舊的一條，而不是我需要的最新一條數(shù)據(jù)我明明已經(jīng)倒序排了，后來總結(jié)出了五種解決方案如下。

注意事項(xiàng)

數(shù)據(jù)庫版本 Mysql5.7+

執(zhí)行 GROUP BY 語句的時候出現(xiàn) sql_mode=only_full_group_by 解決方法（這里是Mysql8的解決方案，Mysql5.7也差不多，具體實(shí)現(xiàn)可以查看解決MySQL-this is incompatible with sql_mode=only_full_group_by 問題）

1、執(zhí)行 select @@sql_mode; 查看sql模式

select @@sql_mode;

在這里插入圖片描述

2、將sql_mode中的only_full_group_by模式剔除重新設(shè)置sql_mode值，如果是使用JDBC連接需要重啟項(xiàng)目才能生效。

set global sql_mode='STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_ENGINE_SUBSTITUTION';
set session sql_mode='STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_ENGINE_SUBSTITUTION';

準(zhǔn)備SQL

這里模擬一個sql

DROP TABLE IF EXISTS `customer_wallet_detail`;
CREATE TABLE `customer_wallet_detail`  (
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `customer_id` bigint(20) NULL DEFAULT NULL COMMENT '用戶ID',
  `happen_amount` varchar(15)  NULL DEFAULT '0' COMMENT '發(fā)生金額 帶-號的代表扣款',
  `balance_amount` varchar(15) NULL DEFAULT '0' COMMENT '可用余額',
  `create_time` bigint(20) NULL DEFAULT NULL COMMENT '發(fā)生時間',
  PRIMARY KEY (`id`) USING BTREE
) ENGINE = InnoDB COMMENT = '用戶錢包明細(xì)';

INSERT INTO `customer_wallet_detail`(`id`, `customer_id`, `happen_amount`, `balance_amount`, `create_time`) VALUES (1, 1, '100', '100', 1670300656630);
INSERT INTO `customer_wallet_detail`(`id`, `customer_id`, `happen_amount`, `balance_amount`, `create_time`) VALUES (2, 1, '-10', '90', 1670300656640);
INSERT INTO `customer_wallet_detail`(`id`, `customer_id`, `happen_amount`, `balance_amount`, `create_time`) VALUES (3, 1, '5', '95', 1670300656650);
INSERT INTO `customer_wallet_detail`(`id`, `customer_id`, `happen_amount`, `balance_amount`, `create_time`) VALUES (4, 3, '998', '998', 1670300656660);
INSERT INTO `customer_wallet_detail`(`id`, `customer_id`, `happen_amount`, `balance_amount`, `create_time`) VALUES (5, 3, '-100', '898', 1670300656670);
INSERT INTO `customer_wallet_detail`(`id`, `customer_id`, `happen_amount`, `balance_amount`, `create_time`) VALUES (6, 3, '-98', '800', 1670300656680);
INSERT INTO `customer_wallet_detail`(`id`, `customer_id`, `happen_amount`, `balance_amount`, `create_time`) VALUES (7, 2, '666', '666', 1670300656690);
INSERT INTO `customer_wallet_detail`(`id`, `customer_id`, `happen_amount`, `balance_amount`, `create_time`) VALUES (8, 2, '-66', '600', 1670300656695);
INSERT INTO `customer_wallet_detail`(`id`, `customer_id`, `happen_amount`, `balance_amount`, `create_time`) VALUES (9, 2, '-600', '0', 1670300656699);

在這里插入圖片描述

錯誤查詢

SELECT
	* 
FROM
	( SELECT * FROM customer_wallet_detail ORDER BY create_time DESC ) t1 
GROUP BY
	t1.customer_id;

在這里插入圖片描述

錯誤原因

在mysql5.7以及之后的版本，如果GROUP BY的子查詢中包含ORDER BY，但是 GROUP BY 不與 LIMIT 配合使用，ORDER BY會被忽略掉，所以子查詢在 GROUP BY 時排序不會生效，可能是因?yàn)樽硬樵兇蠖鄶?shù)是作為一個結(jié)果給主查詢使用，所以子查詢不需要排序。

方法一

鑒于以上的原因我們可以添加上 LIMIT 條件來實(shí)現(xiàn)功能。
PS：這個LIMIT的數(shù)量可以先自行 COUNT 出你要遍歷的數(shù)據(jù)條數(shù)（這個數(shù)據(jù)條數(shù)是所有滿足查詢條件的數(shù)據(jù)合，我這里共9條數(shù)據(jù)）

SELECT
	* 
FROM
	( SELECT * FROM customer_wallet_detail ORDER BY create_time DESC LIMIT 9 ) t1 
GROUP BY
	t1.customer_id;

在這里插入圖片描述

方法二（適用于自增ID和創(chuàng)建時間排序一致）

方法一需要先 COUNT 查詢?nèi)缓髮⒉樵兘Y(jié)果設(shè)置到 LIMIT 條件中比較麻煩，這里還可以使用 MAX() 函數(shù)來實(shí)現(xiàn)該功能。
PS：因?yàn)槲疫@里的業(yè)務(wù)數(shù)據(jù)是有序插入的，使用主鍵自增id和create_time結(jié)果是一樣的而且使用id查詢效率更高，如果沒有唯一且有序的id可以替代create_time那么就用方案一，不能直接使用 SELECT id,MAX(create_time) 這種操作來獲取最新一條數(shù)據(jù)id，原因在總結(jié)中有詳細(xì)描述。

SELECT
	*
FROM
	customer_wallet_detail 
WHERE
	id IN ( SELECT MAX( id ) FROM customer_wallet_detail GROUP BY customer_id ) 
ORDER BY
	customer_id;

在這里插入圖片描述

方法三（適用于自增ID和創(chuàng)建時間排序一致，查詢性能最優(yōu)）

方法三和方法二實(shí)現(xiàn)邏輯基本一致只是將IN查詢替換成了連接查詢，本地20w條數(shù)據(jù)測試方法三比方法二性能提升50%，有興趣的可以增大數(shù)據(jù)集測試后續(xù)性能變化。

SELECT
	t1.* 
FROM
	customer_wallet_detail t1
	INNER JOIN ( SELECT MAX( id ) AS id FROM customer_wallet_detail GROUP BY customer_id ) t2 ON t1.id = t2.id

在這里插入圖片描述

方法四（通過DISTINCT關(guān)鍵字打破MySQL語句優(yōu)化使排序生效）

方法四實(shí)現(xiàn)起來比較簡單，數(shù)據(jù)量小的時候查詢性能也挺不錯的，數(shù)據(jù)量大了之后查詢性能也還可以，我本地測試了100w數(shù)據(jù)的查詢，這個方法耗時0.9s左右，減少DISTINCT的字段能降到0.4s左右，不給customer_id字段加索引的情況下通過方法三查詢耗時0.35s，加了索引耗時0.035s，有興趣可以分析一下方法三和方法四的執(zhí)行計劃。

SELECT
	* 
FROM
	( SELECT DISTINCT * FROM `customer_wallet_detail` ORDER BY id DESC ) AS t1 
GROUP BY
	t1.customer_id;

在這里插入圖片描述

方法五（以創(chuàng)建時間為基準(zhǔn)獲取每個用戶最新的一條數(shù)據(jù)，必須要添加對應(yīng)字段的索引最好是覆蓋索引）

有朋友在評論區(qū)提供了第四種方法，這種方法在表數(shù)據(jù)量少的時候是可行的，我的測試表還是20w數(shù)據(jù)，并且customer_id字段加了索引，全部查詢出來耗時在180s左右，我本地MySQL性能會差一點(diǎn)，這種查詢方式是將 b1 中的每一條數(shù)據(jù) 都和 b2 中的每一條數(shù)據(jù)進(jìn)行比對取出滿足條件的數(shù)據(jù)，b1 有20w條數(shù)據(jù) b2 也有20w條數(shù)據(jù)，如果沒有索引不計算io開銷，只算cpu開銷，這條sql需要進(jìn)行 20w * 20w = 400億次數(shù)據(jù)比對，在有索引的情況下數(shù)據(jù)比對次數(shù)會少一些但是也千萬級的，如果考慮其它開銷并且沒索引的情況下那查詢耗時可想而知。

使用限制

1、這種方式其實(shí)除了性能問題以外還有一個更加嚴(yán)重的問題，在一些業(yè)務(wù)里給用戶余額明細(xì)添加數(shù)據(jù)時可能同一時間戳添加多條，這樣count結(jié)果就大于1了，這個用戶數(shù)據(jù)就查不出來了，還有一種情況如果開發(fā)人員事務(wù)沒有控制好，我們在入庫時一般會提前將create_time填充，但是我們用的是自增ID，入庫時create_time 小的，數(shù)據(jù)ID可能還會大一些，選擇那種方法還是需要看業(yè)務(wù)上怎么設(shè)計的

SELECT
	b1.* 
FROM
	customer_wallet_detail t1 
WHERE
	( SELECT COUNT( 1 ) FROM customer_wallet_detail t1 WHERE t2.customer_id = t1.customer_id AND t1.create_time <= t2.create_time ) <= 1;

在這里插入圖片描述

PS：優(yōu)化方案

1、針對這條語句的查詢特性，我們減少數(shù)據(jù)的查詢條數(shù)，比如給 t1和t2 添加上篩選時間區(qū)間，減少遍歷數(shù)組總數(shù)。
2、使用覆蓋索引，我自己在測試的時候發(fā)現(xiàn)如果使用組合索引包含兩個字段 (customer_id,create_time) 性能會提升很多，20w數(shù)據(jù)查詢出結(jié)果只用了40s，如果只使用customer_id字段索引會進(jìn)行回表，使用覆蓋索引沒有額外的回表操作所以會快很多。

總結(jié)

結(jié)合我的業(yè)務(wù)經(jīng)過測試，目前看來方案三是最合適的，sql簡單性能適中，方案一比方案二性能更差而且實(shí)現(xiàn)麻煩，最終選擇那個方案主要看業(yè)務(wù)而定。

MAX()函數(shù)和MIN()這一類函數(shù)和GROUP BY配合使用存在問題

MAX()函數(shù)和MIN()這一類函數(shù)和GROUP BY配合使用，GROUP BY拿到的數(shù)據(jù)永遠(yuǎn)都是這個分組排序最上面的一條，而MAX()函數(shù)和MIN()這一類函數(shù)會將這個分組中最大或最小的值取出來，這樣會導(dǎo)致查詢出來的數(shù)據(jù)對應(yīng)不上。

正確查詢：

在這里插入圖片描述

錯誤查詢：這里的確拿到每個分組最新創(chuàng)建時間了但是拿的數(shù)據(jù)id還是排序的第一條

在這里插入圖片描述

到此這篇關(guān)于Mysql分組查詢每組最新的一條數(shù)據(jù)的五種實(shí)現(xiàn)方法的文章就介紹到這了,更多相關(guān)Mysql分組查詢內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

相關(guān)文章

MYSQL實(shí)現(xiàn)連續(xù)簽到功能斷簽一天從頭開始(sql語句)
這篇文章主要介紹了MYSQL實(shí)現(xiàn)連續(xù)簽到功能斷簽一天從頭開始，非常不錯，具有參考借鑒價值,需要的朋友可以參考下
2017-05-05
詳解監(jiān)聽MySQL的binlog日志工具分析：Canal
Canal主要用途是基于MySQL數(shù)據(jù)庫增量日志解析，提供增量數(shù)據(jù)訂閱和消費(fèi)，目前主要支持MySQL。接下來通過本文給大家介紹監(jiān)聽MySQL的binlog日志工具分析：Canal的相關(guān)知識，感興趣的朋友一起看看吧
2020-10-10
centos7通過yum安裝mysql的方法
這篇文章主要介紹了centos7通過yum安裝mysql的方法，非常不錯，具有一定的參考借鑒價值,需要的朋友可以參考下
2018-11-11
關(guān)于useSSL=false和true的區(qū)別及說明
這篇文章主要介紹了關(guān)于useSSL=false和true的區(qū)別及說明，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教
2022-08-08
MySQL算術(shù)/比較/邏輯/位/運(yùn)算符與正則舉例詳解
每種數(shù)據(jù)庫都支持SQL語句,但是它們也都有各自支持的運(yùn)算符,下面這篇文章主要給大家介紹了關(guān)于MySQL算術(shù)/比較/邏輯/位/運(yùn)算符與正則的相關(guān)資料,文中通過實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下
2023-02-02
詳細(xì)解讀MySQL中的權(quán)限
這篇文章主要介紹了MySQL中的權(quán)限,包括各個權(quán)限所能操作的事務(wù)以及操作權(quán)限的一些常用命令語句,需要的朋友可以參考下
2015-05-05
mysql同步復(fù)制搭建方法指南詳細(xì)步驟
MySQL數(shù)據(jù)同步主要有三種方式: 1.利用MySQL自身的數(shù)據(jù)庫同步功能 2.利用MySQL數(shù)據(jù)庫的特性(數(shù)據(jù)庫存在固頂目錄,并且以文件形式存儲),進(jìn)行數(shù)據(jù)庫目錄同步以達(dá)到數(shù)據(jù)同步目的 3.利用專用的MySQL數(shù)據(jù)庫同步軟件
2008-04-04
MYSQL命令行模式管理MySql的一點(diǎn)心得
MYSQL命令行模式管理MySql的一點(diǎn)心得...
2007-09-09
本篇文章主要介紹了MySQL 開啟慢查詢?nèi)罩镜姆椒?，小編覺得挺不錯的，現(xiàn)在分享給大家，也給大家做個參考。一起跟隨小編過來看看吧
2017-06-06