亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

如何使用分區(qū)處理MySQL的億級數據優(yōu)化

 更新時間:2021年06月16日 15:14:44   作者:godzla  
mysql在查詢上千萬級數據的時候,通過索引可以解決大部分查詢優(yōu)化問題。但是在處理上億數據的時候,應該怎么解決,本文就是用分區(qū)來優(yōu)化一下,感興趣的一起來了解一下

mysql在查詢上千萬級數據的時候,通過索引可以解決大部分查詢優(yōu)化問題。但是在處理上億數據的時候,索引就不那么友好了。

數據表(日志)是這樣的:

  • 表大?。?T,約24億行;
  • 表分區(qū):按時間分區(qū),每個月為一個分區(qū),一個分區(qū)約2-3億行數據(40-70G左右)。

由于數據不需要全量處理,經過與需求方討論后,我們按時間段抽樣一部分數據,比如抽樣一個月的數據,約3.5億行。
數據處理的思路:

1)建表引擎選擇Innodb。由于數據是按月分區(qū)的,我們將該月分區(qū)的數據單獨copy出來,源表為myisam引擎,因我們可能需要過濾部分數據,涉及到篩選的字段又沒有索引,使用myisam引擎加索引的速度會比較慢;
2)按日分區(qū)。將copy出來的表加好索引后(約2-4個小時),過濾掉無用的數據,同時再次新生成一張表,抽取json中需要的字段,并對該表按日分區(qū)。

CREATE TABLE `tb_name` (
  `id_`,
  ...,
  KEY `idx_1` (`create_user_`) 
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='應用日志'
PARTITION BY RANGE(to_days(log_time_)) (
    PARTITION p1231 VALUES LESS THAN (737425),
    PARTITION p0101 VALUES LESS THAN (737426),
    PARTITION p0102 VALUES LESS THAN (737427),
    PARTITION p0103 VALUES LESS THAN (737428),
    PARTITION p0104 VALUES LESS THAN (737429),
......
);

3)對上面生成的表按每日進行聚合或者其他操作,并將結果存儲到臨時表中,盡量使用存儲過程加工數據,由于加工相對復雜而且耗時較多(跑一次存儲過程需要大概1-2小時),因此循環(huán)調用存儲過程時應記錄操作時間和執(zhí)行過程中的參數等;

delimiter $$
create procedure proc_name(param varchar(50))
begin
 declare start_date date;
    declare end_date date;
    set start_date = '2018-12-31';
    set end_date = '2019-02-01';
    
    start transaction;
 truncate tmp_talbe;
 commit;
    
    while start_date < end_date do
  set @partition_name = date_format(start_date, '%m%d');
        set @start_time = now(); -- 記錄當前分區(qū)操作起始時間
        
  start transaction;
  set @sqlstr = concat(
   "insert into tmp_talbe",
   "select field_names ",
            "from tb_name partition(p", @partition_name,") t ",
            "where conditions;"
   );
  -- select @sqlstr;
  prepare stmt from @sqlstr;  
  execute stmt;
  deallocate prepare stmt;
  commit;
        
        -- 插入日志
        set @finish_time = now(); -- 操作結束時間
        insert into oprerate_log values(param, @partition_name, @start_time, @finish_time, timestampdiff(second, @start_time, @finish_time));
        
  set start_date = date_add(start_date, interval 1 day);
    end while;
end
$$
delimiter ;

4)對上述生成的結果進行整理加工。

總的來說,處理過程相對繁瑣,而且產生了很多中間表,對關鍵步驟還需要記錄操作流程的元數據,這對SQL處理的要求會比較高,因此不建議使用MySQL處理這種任務(除非迫不得已),如果能將能處理過程放在大數據平臺上處理,速度會更快,而且元數據管理會相對專業(yè)。

到此這篇關于如何使用分區(qū)處理MySQL的億級數據優(yōu)化的文章就介紹到這了,更多相關MySQL 億級數據優(yōu)化內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

  • MySQL max_allowed_packet的坑

    MySQL max_allowed_packet的坑

    max_allowed_packet是 MySQL 中的一個設定參數,用于設定所接受的包的大小,根據情形不同,其缺省值可能是 1M 或者 4M,本文主要介紹了MySQL max_allowed_packet的坑,感興趣的可以了解一下
    2024-01-01
  • MySQL需要根據特定順序排序的實現方法

    MySQL需要根據特定順序排序的實現方法

    在MySQL中,我們可以通過指定順序排序來在查詢結果中控制數據的排列順序,這種排序方式是非常有用的,本文就來介紹一下,感興趣的可以了解一下
    2023-11-11
  • CentOS6.9+Mysql5.7.18源碼安裝詳細教程

    CentOS6.9+Mysql5.7.18源碼安裝詳細教程

    CentOS6.9+Mysql5.7.18源碼安裝,以下操作均在root用戶下執(zhí)行。下面通過本教程給大家詳細介紹CentOS6.9+Mysql5.7.18源碼安裝方法,需要的的朋友參考下吧
    2017-06-06
  • mysql now()函數調用系統(tǒng)時間不對的解決方法

    mysql now()函數調用系統(tǒng)時間不對的解決方法

    mysql的now()函數與實際時間不符,本文就詳細的介紹一下mysql now()函數調用系統(tǒng)時間不對的解決方法,非常具有實用價值,需要的朋友可以參考下
    2023-05-05
  • 關于Mysql8.0版本驅動getTables返回所有庫的表問題淺析

    關于Mysql8.0版本驅動getTables返回所有庫的表問題淺析

    這篇文章主要給大家介紹了關于Mysql 8.0版本驅動getTables返回所有庫的表問題的相關資料,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2018-12-12
  • mysql安裝navicat之后,出現2059,Authentication plugin及本地鏈接虛擬機docker,遠程鏈接服務器

    mysql安裝navicat之后,出現2059,Authentication plugin及本地鏈接虛擬機docker,

    這篇文章主要介紹了mysql安裝navicat之后,出現2059,Authentication plugin及本地鏈接虛擬機docker,遠程鏈接服務器,需要的朋友可以參考下
    2020-06-06
  • MySQL 分組查詢的優(yōu)化方法

    MySQL 分組查詢的優(yōu)化方法

    這篇文章主要介紹了MySQL 分組查詢的優(yōu)化方法,幫助大家更好的理解和學習使用MySQL,感興趣的朋友可以了解下
    2021-05-05
  • 最新評論