python 實現(xiàn)讀取csv數(shù)據(jù),分類求和 再寫進 csv
這兩天在測試過程中,遇到這樣的問題:
數(shù)據(jù)量很大,一份csv文件的數(shù)據(jù)與另外一個文件的數(shù)據(jù)進行對比,但是csv中的文件數(shù)據(jù)量很大,并且進行統(tǒng)計 ,如果手動單個去對比,會很花時間,吃力不討好,還容易出錯。
比如說,這樣的數(shù)據(jù)
需要對AskPrice值相同對應的AskQuantity 統(tǒng)計出來。
直接上腳本 :
import pandas as pd import csv df=pd.read_csv('D:\test\orderBook.csv') df_sum = df.groupby('AskPrice')['AskQuantity'].sum() df_sum.to_csv('D:\test\orderBook2.csv')
然后運行得到:
這對于大數(shù)據(jù)量的處理特別方便。
補充知識:python處理csv文件(場景分類)
最近做一個關于場景分類的比賽,總共有20類,不到2萬張圖片,首先要做的就是把20類圖片分到每個文件夾下。
import numpy as np import os import xlrd import pandas as pd import shutil list_0 = [] list_file = [] flag = [] filename = os.listdir('F:\工作\比賽\未來杯\image_scene_training\data') af = pd.read_excel('19.xlsx') ww = af.values.tolist() for i in ww: for j in i: list_0.append(j) for name in filename: list_file.append(name[0:-4]) for name in list_file: if name in list_0: flag.append(True) else: flag.append(False) for name in list_file: if flag[list_file.index(name)]: oldname = u'F:\工作\比賽\未來杯\image_scene_training\data\\'+name+'.jpg' newname = u'F:\工作\比賽\未來杯\image_scene_training\\train_data\\beach\\'+name+'.jpg' shutil.copyfile(oldname,newname)
unicodeDecodeError:'utf-8' codec can't decode byte 0xce in position 72: invalid continuation byte
1:升級pip python -m pip install --upgrade pip
2:改python文件內(nèi)容:找到lib\site-packages\pip\compat\__init__.py
return s.decode('utf-8')
將‘utf-8'改成'gbk'
以上這篇python 實現(xiàn)讀取csv數(shù)據(jù),分類求和 再寫進 csv就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關文章
Python web開發(fā)之用Tornado框架制作簡易表白墻網(wǎng)站
這篇文章將用Python做Web開發(fā)。在Python當中,WEB開發(fā)框架主要有三個,本文將利用Tornado框架做一個簡單的表白墻網(wǎng)站,感興趣的可以了解一下2022-02-02使用Jest?在?Visual?Studio?Code?中進行單元測試的流程分析
Jest是一個流行的JavaScript測試框架,它提供了簡潔、靈活和強大的工具來編寫和運行單元測試,今天通過本文給大家介紹使用Jest在Visual Studio Code中進行單元測試的流程分析,感興趣的朋友跟隨小編一起看看吧2023-07-07python使用xauth方式登錄飯否網(wǎng)然后發(fā)消息
這篇文章主要介紹了python使用xauth方式登錄飯否網(wǎng)然后發(fā)消息示例,需要的朋友可以參考下2014-04-04Python使用嵌套循環(huán)實現(xiàn)圖像處理算法
這篇文章主要給大家詳細介紹Python如何使用嵌套循環(huán)實現(xiàn)圖像處理算法,文中有詳細的代碼示例,具有一定的參考價值,需要的朋友可以參考下2023-07-07詳解pandas中缺失數(shù)據(jù)處理的函數(shù)
這篇文章主要為大家詳細介紹一下pandas中處理缺失數(shù)據(jù)的一些函數(shù),文中具體講解了一下各個函數(shù)的使用,需要的可以參考一下2022-01-01