利用numpy和pandas處理csv文件中的時(shí)間方法
環(huán)境:numpy,pandas,python3
在機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的過(guò)程中,對(duì)于處理預(yù)測(cè),回歸問(wèn)題,有時(shí)候變量是時(shí)間,需要進(jìn)行合適的轉(zhuǎn)換處理后才能進(jìn)行學(xué)習(xí)分析,關(guān)于時(shí)間的變量如下所示,利用pandas和numpy對(duì)csv文件中時(shí)間進(jìn)行處理。
date (UTC) Price 01/01/2015 0:00 48.1 01/01/2015 1:00 47.33 01/01/2015 2:00 42.27
#coding:utf-8 import datetime import pandas as pd import numpy as np import pickle #用pandas將時(shí)間轉(zhuǎn)為標(biāo)準(zhǔn)格式 dateparse = lambda dates: pd.datetime.strptime(dates,'%d/%m/%Y %H:%M') #將時(shí)間欄合并,并轉(zhuǎn)為標(biāo)準(zhǔn)時(shí)間格式 rawdata = pd.read_csv('RealMarketPriceDataPT.csv',parse_dates={'timeline':['date','(UTC)']},date_parser=dateparse) #定義一個(gè)將時(shí)間轉(zhuǎn)為數(shù)字的函數(shù),s為字符串 def datestr2num(s): #toordinal()將時(shí)間格式字符串轉(zhuǎn)為數(shù)字 return datetime.datetime.strptime(s,'%Y-%m-%d %H:%M:%S').toordinal() x = [] y = [] new_date = [] for i in range(rawdata.shape[0]): x_convert = int(datestr2num(str(rawdata.ix[i,0]))) new_date.append(x_convert) y_convert = rawdata.ix[i,1].astype(np.float32) x.append(x_convert) y.append(y_convert) x = np.array(x).astype(np.float32) """ with open('price.pickle','wb') as f: pickle.dump((x,y),f) """ print(datetime.datetime.fromordinal(new_date[0]),'------>>>>>>',new_date[0]) print(datetime.datetime.fromordinal(new_date[10]),'------>>>>>>',new_date[10]) print(datetime.datetime.fromordinal(new_date[20]),'------>>>>>>',new_date[20]) print(datetime.datetime.fromordinal(new_date[30]),'------>>>>>>',new_date[30]) print(datetime.datetime.fromordinal(new_date[40]),'------>>>>>>',new_date[40]) print(datetime.datetime.fromordinal(new_date[50]),'------>>>>>>',new_date[50])
結(jié)果
將csv文件中的時(shí)間欄合并為一列,并轉(zhuǎn)為方便數(shù)據(jù)分析的float或int類(lèi)型
以上這篇利用numpy和pandas處理csv文件中的時(shí)間方法就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
分析總結(jié)Python數(shù)據(jù)化運(yùn)營(yíng)KMeans聚類(lèi)
本文主要以 Python 使用 Keans 進(jìn)行聚類(lèi)分析的簡(jiǎn)單舉例應(yīng)用介紹聚類(lèi)分析,它是探索性數(shù)據(jù)挖掘的主要任務(wù),也是統(tǒng)計(jì)數(shù)據(jù)分析的常用技術(shù),用于許多領(lǐng)域2021-08-08python批量獲取html內(nèi)body內(nèi)容的實(shí)例
今天小編就為大家分享一篇python批量獲取html內(nèi)body內(nèi)容的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-01-01Python通過(guò)wordcloud庫(kù)實(shí)現(xiàn)將單詞生成詞云
Python的wordcloud庫(kù)是一個(gè)用于生成詞云的Python包,它可以將一段文本中出現(xiàn)頻率高的單詞按其出現(xiàn)頻率大小以及顏色深淺排列成一個(gè)詞云圖形,從而更好地展示文本中的信息,你可以使用wordcloud庫(kù)來(lái)生成各種類(lèi)型的詞云,本文就介紹了如何生成心型詞云2023-06-06如何利用Python實(shí)現(xiàn)自動(dòng)打卡簽到的實(shí)踐
簽到,都是規(guī)律性的操作,何嘗不寫(xiě)一個(gè)程序加到Windows實(shí)現(xiàn)自動(dòng)簽到呢,本文就主要介紹了如何利用Python實(shí)現(xiàn)自動(dòng)打卡簽到的實(shí)踐,具有一定的參考價(jià)值,感興趣的可以了解一下2021-12-12Django中數(shù)據(jù)庫(kù)的數(shù)據(jù)關(guān)系:一對(duì)一,一對(duì)多,多對(duì)多
今天小編就為大家分享一篇關(guān)于Django中數(shù)據(jù)庫(kù)的數(shù)據(jù)關(guān)系:一對(duì)一,一對(duì)多,多對(duì)多,小編覺(jué)得內(nèi)容挺不錯(cuò)的,現(xiàn)在分享給大家,具有很好的參考價(jià)值,需要的朋友一起跟隨小編來(lái)看看吧2018-10-10GitHub?AI編程工具copilot在Pycharm的應(yīng)用
最近聽(tīng)說(shuō)github出了一種最新的插件叫做copilot,這篇文章主要給大家介紹了關(guān)于GitHub?AI編程工具copilot在Pycharm的應(yīng)用,目前感覺(jué)確實(shí)不錯(cuò),建議大家也去使用,需要的朋友可以參考下2022-04-04