python處理csv中的空值方法
更新時間:2018年06月22日 09:49:41 作者:勿在浮沙筑高臺LS
今天小編就為大家分享一篇python處理csv中的空值方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
如下所示:
# -*- coding: UTF-8 -*- import jieba.posseg import tensorflow as tf import pandas as pd import csv import math """ 1.必須獲取CSV文件夾(ID:文本) 2.返回(ID:分詞后的文本) """ flags = tf.app.flags flags.DEFINE_string("train_file_address","D:/NLPWORD/cut_word_test/hzytest.csv","添加訓練數(shù)據(jù)文件") flags.DEFINE_string("result_file_address","D:/NLPWORD/cut_word_test/hzytest_result.csv","生成結(jié)果數(shù)據(jù)文件") FLAGS = tf.app.flags.FLAGS def cut_word(train_data): """ 把數(shù)據(jù)按照行進行遍歷,然后把結(jié)果按照行寫在csv中 :return:分詞結(jié)果list """ jieba.load_userdict("newdict.txt") with open(FLAGS.result_file_address, "w", encoding='utf8') as csvfile: writer = csv.writer(csvfile) for row in train_data.index: datas = train_data.loc[row].values[1] if isinstance(datas,str) or not math.isnan(datas): words = jieba.posseg.cut(datas) line = '' for word in words: line = line + word.word + " " writer.writerow([train_data.loc[row].values[0], line]) def main(_): data = pd.read_csv(FLAGS.train_file_address) cut_word(data) if __name__ == "__main__": tf.app.run(main)
以上這篇python處理csv中的空值方法就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python畫柱狀統(tǒng)計圖操作示例【基于matplotlib庫】
這篇文章主要介紹了Python畫柱狀統(tǒng)計圖操作,結(jié)合實例形式分析了Python基于matplotlib庫實現(xiàn)圖形繪制的相關(guān)操作技巧,需要的朋友可以參考下2018-07-07一文搞懂Python中pandas透視表pivot_table功能
透視表是一種可以對數(shù)據(jù)動態(tài)排布并且分類匯總的表格格式。或許大多數(shù)人都在Excel使用過數(shù)據(jù)透視表,也體會到它的強大功能,而在pandas中它被稱作pivot_table,今天通過本文給大家介紹Python中pandas透視表pivot_table功能,感興趣的朋友一起看看吧2021-11-11