postgresql實(shí)現(xiàn)對(duì)已有數(shù)據(jù)表分區(qū)處理的操作詳解
背景:業(yè)務(wù)初期創(chuàng)建的一張表,有 20 個(gè)字段,沒有超長超大字段。隨著系統(tǒng)運(yùn)行,數(shù)據(jù)量來到了將近 1.3 億行約 60GB。目前整體穩(wěn)定,考慮到后續(xù)數(shù)據(jù)持續(xù)增長,打算先對(duì)表進(jìn)行分區(qū)處理??紤]分區(qū)的主要因素是,這張表的數(shù)據(jù)主要是插入,和對(duì)最近插入數(shù)據(jù)的查詢,后續(xù)會(huì)有少量針對(duì)該表的全量查詢操作。
一、對(duì)已有數(shù)據(jù)進(jìn)行備份
創(chuàng)建備份表并將所有的數(shù)據(jù)備份到 t_test_back
表里。這種方式備份,只會(huì)復(fù)制表結(jié)構(gòu)和表數(shù)據(jù),不會(huì)包含索引和約束。并且這種方式不會(huì)涉及到加鎖等操作,整體執(zhí)行很快,60GB 的數(shù)據(jù)大概在 5 分鐘左右備份完成。
create table public.t_test_back as (select * from public.t_test);
二、刪除原表
刪除原表之前,記得先保留好建表語句,原表索引和約束,原建表語句如下:
CREATE TABLE public.t_test ( id bigserial NOT NULL, column1 int8 NOT NULL, column2 varchar NOT NULL, column3 varchar NULL, create_time timestamptz NULL, CONSTRAINT t_test_pkey PRIMARY KEY (id) ); CREATE INDEX column1_idx ON public.t_test USING btree (column1); CREATE INDEX column2_idx ON public.t_test USING btree (column2);
刪除原表直接使用 drop
語句:
drop table public.t_test;
我執(zhí)行的時(shí)候,大概十分鐘沒有反應(yīng),最后查詢檢查 pg_stat_activity
視圖,發(fā)現(xiàn) public.t_test
還有 active
sql 執(zhí)行。
通過下面的方式,將在執(zhí)行中的 sql 全部中斷掉。
-- 找到當(dāng)前表還在執(zhí)行的查詢 select pid, query, state from pg_stat_activity where state = 'state' and query like '%t_test%'; -- 可以取消查詢 select pg_cancel_backend(pid); -- 也可以強(qiáng)制中止會(huì)話 select pg_terminate_backend(pid);
將執(zhí)行中的查詢?nèi)∠螅?code>drop 操作很快完成,正常執(zhí)行預(yù)估也是在 5 分鐘左右能執(zhí)行完成。
三、創(chuàng)建分區(qū)表
根據(jù)原表建表語句創(chuàng)建分區(qū)表,其中分區(qū)字段需要作為pk的一部分,我使用時(shí)間字段 create_time
作 range
分區(qū):
CREATE TABLE public.t_test ( id bigserial NOT NULL, column1 int8 NOT NULL, column2 varchar NOT NULL, column3 varchar NULL, create_time timestamptz NOT null DEFAULT CURRENT_TIMESTAMP, CONSTRAINT t_test_pkey PRIMARY KEY (id, create_time) ) partition by range(create_time);
我這里一年的數(shù)據(jù)量大概是 8 千萬,我按照半年一個(gè)分區(qū)建表,最后有一個(gè) DEFAULT 的分區(qū)表,用來存儲(chǔ)分區(qū)以外的數(shù)據(jù):
create table public.t_test_2022_02 partition of public.t_test for values from ('2022-06-01 00:00:00') to ('2022-12-31 23:59:59'); create table public.t_test_2023_01 partition of public.t_test for values from ('2023-01-01 00:00:00') to ('2023-06-30 23:59:59'); create table public.t_test_2023_02 partition of public.t_test for values from ('2023-07-01 00:00:00') to ('2023-12-31 23:59:59'); create table public.t_test_2024_01 partition of public.t_test for values from ('2024-01-01 00:00:00') to ('2024-06-30 23:59:59'); create table public.t_test_2024_02 partition of public.t_test for values from ('2024-07-01 00:00:00') to ('2024-12-31 23:59:59'); create table public.t_test_default partition of public.t_test DEFAULT;
我這里將原來的索引直接用在分區(qū)表的主表上:
CREATE INDEX column1_idx ON public.t_test USING btree (column1); CREATE INDEX column2_idx ON public.t_test USING btree (column2);
由于我使用的 postgresql
的 serial
類型做 id
字段的自增序列,所以還需要將序列的最新值更新到比之前表的最大 id 還要大。防止主鍵沖突。
alter sequence public.t_test_id_seq restart 340000000;
四、數(shù)據(jù)恢復(fù)
由于我的表的數(shù)據(jù)主要使用的是增量數(shù)據(jù),所以我把 id 最大的一條數(shù)據(jù)插入數(shù)據(jù)庫表后,就可以恢復(fù)服務(wù)。 最后用 sql 將剩余的數(shù)據(jù)插入新表即可:
insert into public.t_test (select * from public.t_test_back);
到此這篇關(guān)于postgresql實(shí)現(xiàn)對(duì)已有數(shù)據(jù)表分區(qū)處理的操作詳解的文章就介紹到這了,更多相關(guān)postgresql數(shù)據(jù)表分區(qū)處理內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
PostgreSQL中關(guān)閉死鎖進(jìn)程的方法
這篇文章主要介紹了PostgreSQL中關(guān)閉死鎖進(jìn)程的方法,本文給出兩種解決這問題的方法,需要的朋友可以參考下2015-02-02Postgres 創(chuàng)建Role并賦予權(quán)限的操作
這篇文章主要介紹了 Postgres 創(chuàng)建Role并賦予權(quán)限的操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2021-01-01PostgreSQL實(shí)現(xiàn)定期備份的方法
PostgreSQL定期備份功能可以自動(dòng)備份數(shù)據(jù)庫,避免了手動(dòng)備份過程中可能發(fā)生的錯(cuò)誤,也極大地減輕了管理員的工作壓力,所以本文將給大家介紹一下PostgreSQL實(shí)現(xiàn)定期備份的方法,需要的朋友可以參考下2024-03-03postgresql 如何查看pg_wal目錄下xlog文件總大小
這篇文章主要介紹了postgresql 如何查看pg_wal目錄下xlog文件總大小的操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2021-01-01PostgreSQL 對(duì)IN,EXISTS,ANY/ALL,JOIN的sql優(yōu)化方案
這篇文章主要介紹了PostgreSQL 對(duì)IN,EXISTS,ANY/ALL,JOIN的sql優(yōu)化方案,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2021-01-01