Pandas中的日期時(shí)間date處理小結(jié)
Pandas提供了強(qiáng)大的日期和時(shí)間處理功能,這對(duì)于時(shí)間序列分析至關(guān)重要。本教程將介紹Pandas中處理日期時(shí)間的主要方法。包括:
- 日期時(shí)間數(shù)據(jù)的創(chuàng)建和轉(zhuǎn)換
- 日期時(shí)間屬性的提取
- 時(shí)間差計(jì)算和日期運(yùn)算
- 重采樣和頻率轉(zhuǎn)換
- 時(shí)區(qū)處理
- 基于日期時(shí)間的索引操作
Pandas中的日期時(shí)間類型
時(shí)間戳(timestamp)
:表示的是一個(gè)特定的時(shí)刻,比如 2008 年 8 月 8 日下午午 8:00。時(shí)間周期(period)
:引用特定開始和結(jié)束點(diǎn)之間的時(shí)間長(zhǎng)度;例如,2015 年。時(shí)間段通常引用時(shí)間間隔的特殊情況,其中每個(gè)間隔具有統(tǒng)一的長(zhǎng)度并且不重疊(例如,構(gòu)成每天的 24 小時(shí)長(zhǎng)的時(shí)間段)。時(shí)間增量或間隔(timedelta)
:引用確切的時(shí)間長(zhǎng)度(例如,間隔為 22.56 秒)。
1. 創(chuàng)建日期時(shí)間數(shù)據(jù)
1.1 使用to_datetime()函數(shù)
import pandas as pd # 將字符串轉(zhuǎn)換為datetime date_str = ['2023-01-01', '2023-01-02', '2023-01-03'] dates = pd.to_datetime(date_str) print(dates)
1.2 創(chuàng)建日期范圍
# 創(chuàng)建日期范圍 date_range = pd.date_range('2023-01-01', periods=5, freq='D') print(date_range) # 帶有時(shí)區(qū)的日期范圍 date_range_tz = pd.date_range('2023-01-01', periods=5, freq='D', tz='Asia/Shanghai') print(date_range_tz)
2. 訪問日期時(shí)間屬性
# 創(chuàng)建示例DataFrame df = pd.DataFrame({ 'date': pd.date_range('2023-01-01', periods=5, freq='D'), 'value': [10, 20, 30, 40, 50] }) # 提取年、月、日等屬性 df['year'] = df['date'].dt.year df['month'] = df['date'].dt.month df['day'] = df['date'].dt.day df['day_of_week'] = df['date'].dt.dayofweek # 周一=0, 周日=6 df['day_name'] = df['date'].dt.day_name() df['is_weekend'] = df['date'].dt.dayofweek >= 5 print(df)
3. 日期時(shí)間運(yùn)算
3.1 時(shí)間差計(jì)算
# 計(jì)算時(shí)間差 df['date_diff'] = df['date'] - df['date'].shift(1) print(df[['date', 'date_diff']]) # 使用Timedelta進(jìn)行時(shí)間運(yùn)算 df['date_plus_2days'] = df['date'] + pd.Timedelta(days=2) df['date_plus_3hours'] = df['date'] + pd.Timedelta(hours=3) print(df)
3.2 日期比較
# 日期比較 start_date = pd.to_datetime('2023-01-02') df['after_start_date'] = df['date'] > start_date print(df[['date', 'after_start_date']])
4. 重采樣和時(shí)間頻率轉(zhuǎn)換
# 創(chuàng)建示例時(shí)間序列數(shù)據(jù) ts = pd.Series( [1, 2, 3, 4, 5], index=pd.date_range('2023-01-01', periods=5, freq='D') ) # 降采樣(低頻) - 計(jì)算每周平均值 weekly = ts.resample('W').mean() print("Weekly resample:\n", weekly) # 升采樣(高頻) - 填充缺失值 hourly = ts.resample('H').ffill() print("Hourly resample (forward fill):\n", hourly.head(10)) # 只顯示前10行
5. 時(shí)區(qū)處理
# 本地化時(shí)區(qū) ts = pd.Series( [1, 2, 3], index=pd.date_range('2023-01-01', periods=3, freq='D') ) ts = ts.tz_localize('UTC') print("UTC timezone:\n", ts) # 時(shí)區(qū)轉(zhuǎn)換 ts_shanghai = ts.tz_convert('Asia/Shanghai') print("Shanghai timezone:\n", ts_shanghai)
6. 日期時(shí)間索引操作
# 設(shè)置日期為索引 df.set_index('date', inplace=True) # 按年份切片 print(df.loc['2023']) # 按月份切片 print(df.loc['2023-01']) # 按日期范圍切片 print(df.loc['2023-01-02':'2023-01-04'])
7. 實(shí)際應(yīng)用示例
# 讀取包含日期時(shí)間的數(shù)據(jù) # 假設(shè)有一個(gè)CSV文件包含日期列 # df = pd.read_csv('data.csv', parse_dates=['date_column']) # 處理缺失日期 full_date_range = pd.date_range(start=df.index.min(), end=df.index.max(), freq='D') df = df.reindex(full_date_range) # 填充缺失值 df['value'] = df['value'].fillna(method='ffill') # 前向填充 # 計(jì)算滾動(dòng)平均值 df['7_day_avg'] = df['value'].rolling(window='7D').mean() print(df.head(10))
8. 高級(jí)技巧
8.1 自定義工作日歷
from pandas.tseries.offsets import CustomBusinessDay from pandas.tseries.holiday import USFederalHolidayCalendar # 使用美國(guó)聯(lián)邦假日日歷 us_bd = CustomBusinessDay(calendar=USFederalHolidayCalendar()) date_range = pd.date_range('2023-01-01', periods=10, freq=us_bd) print("US business days only:\n", date_range)
8.2 季度數(shù)據(jù)處理
# 創(chuàng)建季度數(shù)據(jù) quarterly = pd.Series( [100, 200, 300, 400], index=pd.date_range('2023-01-01', periods=4, freq='Q') ) # 季度開始和結(jié)束日期 print("Quarter start:\n", quarterly.index) print("Quarter end:\n", quarterly.index + pd.offsets.QuarterEnd())
到此這篇關(guān)于Pandas中的日期時(shí)間date處理小結(jié)的文章就介紹到這了,更多相關(guān)Pandas 日期時(shí)間date內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- Pandas中datetime數(shù)據(jù)類型的使用
- 關(guān)于pandas中的.update()方法解析
- Python中的Pandas?時(shí)間函數(shù)?time?、datetime?模塊和時(shí)間處理基礎(chǔ)講解
- 關(guān)于pandas.date_range()的用法及說明
- pandas庫中to_datetime()方法的使用解析
- pandas實(shí)現(xiàn)datetime64與unix時(shí)間戳互轉(zhuǎn)
- pandas時(shí)間序列之pd.to_datetime()的實(shí)現(xiàn)
- python3中datetime庫,time庫以及pandas中的時(shí)間函數(shù)區(qū)別與詳解
相關(guān)文章
python中圖片轉(zhuǎn)換為pdf實(shí)現(xiàn)方法
本文主要介紹了使用Python的Pillow分支和reportlab庫將圖片轉(zhuǎn)換為PDF文件,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2025-03-03Python的numpy庫下的幾個(gè)小函數(shù)的用法(小結(jié))
這篇文章主要介紹了Python的numpy庫下的幾個(gè)小函數(shù)的用法,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-07-07python向xls寫入數(shù)據(jù)(包括合并,邊框,對(duì)齊,列寬)
這篇文章主要介紹了python向xls寫入數(shù)據(jù)(包括合并,邊框,對(duì)齊,列寬),幫助大家更好的利用python處理表格,感興趣的朋友可以了解下2021-02-02jupyter notebook遠(yuǎn)程訪問不了的問題解決方法
這篇文章主要介紹了jupyter notebook遠(yuǎn)程訪問不了的問題解決方法,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-01-01掌握python polars庫進(jìn)行高效高速的數(shù)據(jù)處理。
這篇文章主要介紹了python polars庫進(jìn)行高效高速的數(shù)據(jù)處理技巧詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2024-01-01Python3實(shí)現(xiàn)并發(fā)檢驗(yàn)代理池地址的方法
這篇文章主要介紹了Python3實(shí)現(xiàn)并發(fā)檢驗(yàn)代理池地址的方法,實(shí)例分析了Python3基于線程的代理檢驗(yàn)操作相關(guān)技巧,需要的朋友可以參考下2016-09-09一文詳解Python三引號(hào)(“““)的五個(gè)神奇用法
今天我們來聊一聊 Python 中的一個(gè)神奇字符——三引號(hào)("""),三引號(hào)"""不僅僅是用來定義多行字符串的簡(jiǎn)單工具,它還隱藏著許多令人驚嘆的用途,感興趣的小伙伴跟著小編一起來看看吧2025-04-04driver = webdriver.Chrome()報(bào)錯(cuò)問題及解決
這篇文章主要介紹了driver = webdriver.Chrome()報(bào)錯(cuò)問題及解決方案,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-02-02