亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Pandas數(shù)據(jù)如何讀取與導出

 更新時間:2025年01月22日 11:06:25   作者:王小工  
Pandas是一個強大的Python庫,用于數(shù)據(jù)處理和分析,它提供了多種文件格式的數(shù)據(jù)讀取和導出方法,包括CSV、Excel、SQL數(shù)據(jù)庫、JSON等,常用的數(shù)據(jù)讀取方法為`pd.read_csv()`、`pd.read_excel()`等,導出方法為`to_csv()`、`to_excel()`等

Pandas數(shù)據(jù)讀取與導出

Pandas 是一個強大的 Python 庫,用于數(shù)據(jù)處理和分析。它提供了許多函數(shù)來讀取和導入數(shù)據(jù),支持多種文件格式,如 CSV、Excel、SQL 數(shù)據(jù)庫、JSON 等。

以下是一些常用的數(shù)據(jù)讀取和導出方法:

常用方法

格式文件格式讀取函數(shù)寫入(導出)函數(shù)
binaryExcelread_excelto_excel
textCSVread_csv read_tableto_csv
textJSONread_jsonto_json
text網(wǎng)頁表格HTMLread_htmlto_html
text剪切板read_clipboardto_clipboard
SQ!LSQLread_sqlto_sql
XMLread_xmlread_xml
textMarkdownto_markdown

其中:

  • 讀取函數(shù)一般會賦值給一個變量 df, df = pd.read_()
  • 輸出函數(shù)是將變量自身進行操作并輸出 df.to_()

常用函數(shù)方法

Excel 對象

~ pd.ExcelFile 對象
~ pd.ExcelWriter 對象
~ pd.ExcelWriter 對象的屬性和方法

讀取數(shù)據(jù)

~ pd.read_csv()
~ pd.read_excel()
~ pd.json_normalize()
~ pd.read_pickle()
~ pd.read_table()
~ pd.DataFrame.from_dict() 從字典創(chuàng)建 DataFrame
~ pd.read_clipboard() 從剪貼板讀取數(shù)據(jù)
~ pd.read_json() 讀取 JSON
~ pd.read_sql() 讀取數(shù)據(jù)庫數(shù)據(jù)
~ pd.read_fwf() 讀取固定寬度格式文件
~ pd.read_html() 從 HTML 文檔提取表格數(shù)據(jù)
~ pd.read_parquet() 讀取 Parquet 文件

導出數(shù)據(jù)

~ to_csv() 導出為 CSV文件
~ to_excel() 導出為 Excel 文件
~ to_dict() 輸出字典
~ to_pickle() 序列化為 pickle 文件
~ to_json() 轉換為 JSON 格式字符串
~ to_html() 轉換為 HTML 表格格式
~ to_sql() 寫入到關系型數(shù)據(jù)庫
~ to_parquet() 保存為 parquet 文件

數(shù)據(jù)讀取

  1. 讀取 CSV 文件
import pandas as pd
 
df = pd.read_csv('file.csv')
# 可以使用參數(shù)來調(diào)整讀取行為,如分隔符、缺失值標記、列名等
  1. 讀取 Excel 文件
df = pd.read_excel('file.xlsx', sheet_name='Sheet1')
# 可以指定工作表名稱或索引,或者使用 sheet_name=None 來讀取所有工作表
  1. 從 SQL 數(shù)據(jù)庫讀取
import sqlite3  # 或其他數(shù)據(jù)庫連接庫
 
conn = sqlite3.connect('database.db')
df = pd.read_sql_query('SELECT * FROM table_name', conn)
conn.close()
# 對于其他數(shù)據(jù)庫,如 MySQL、PostgreSQL,需要使用相應的連接庫和驅(qū)動
  1. 讀取 JSON 文件
df = pd.read_json('file.json')
# 可以使用 orient 參數(shù)來指定 JSON 數(shù)據(jù)的布局
  1. 讀取 HTML 表格
df = pd.read_html('http://example.com/page_with_table.html')[0]
# read_html 返回一個 DataFrame 列表,通常使用索引 [0] 來獲取第一個表格
  1. 從剪貼板讀取
df = pd.read_clipboard()
# 這對于從 Excel 等應用程序中復制數(shù)據(jù)特別有用

數(shù)據(jù)導出

  1. 導出到 CSV 文件
df.to_csv('output_file.csv', index=False)
# index=False 表示不導出 DataFrame 的索引
  1. 導出到 Excel 文件
df.to_excel('output_file.xlsx', sheet_name='Sheet1', index=False)
# 可以指定工作表名稱和其他選項,如引擎(對于較新的 Pandas 版本,默認引擎為 'openpyxl')
  1. 導出到 SQL 數(shù)據(jù)庫
conn = sqlite3.connect('database.db')
df.to_sql('table_name', conn, if_exists='replace', index=False)
conn.close()
# if_exists 參數(shù)可以是 'fail'(如果表存在則引發(fā)錯誤)、'replace'(替換表)、'append'(在表中添加數(shù)據(jù))
  1. 導出到 JSON 文件
df.to_json('output_file.json', orient='records', lines=True)
# orient 參數(shù)可以指定 JSON 數(shù)據(jù)的布局,lines=True 表示每行是一個 JSON 對象
  1. 導出到 HTML 文件
with open('output_file.html', 'w') as f:
    f.write(df.to_html())
# 也可以使用 pandas 提供的 to_html() 方法生成 HTML 字符串,然后保存到文件中
  1. 導出到 Excel 的多個工作表
with pd.ExcelWriter('output_file_with_sheets.xlsx') as writer:
    df1.to_excel(writer, sheet_name='Sheet1', index=False)
    df2.to_excel(writer, sheet_name='Sheet2', index=False)
# 使用 ExcelWriter 上下文管理器可以方便地寫入多個工作表

注意事項:

  • 文件路徑:確保文件路徑正確,并且程序有適當?shù)淖x寫權限。
  • 數(shù)據(jù)類型:在導出時,注意數(shù)據(jù)類型的兼容性,特別是當數(shù)據(jù)包含特殊字符或日期時間類型時。
  • 依賴項:某些導出方法(如到 SQL 數(shù)據(jù)庫)可能需要額外的庫和數(shù)據(jù)庫驅(qū)動。
  • 性能:對于大型數(shù)據(jù)集,導出到某些格式(如 Excel)可能會很慢,并且可能會受到內(nèi)存限制。在這種情況下,考慮將數(shù)據(jù)分批導出或使用更適合大數(shù)據(jù)集的格式(如 CSV)。

總結

以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。

相關文章

  • 淺談python的elementtree模塊處理中文注意事項

    淺談python的elementtree模塊處理中文注意事項

    這篇文章主要介紹了淺談python的elementtree模塊處理中文注意事項,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-03-03
  • python標準庫random模塊處理隨機數(shù)

    python標準庫random模塊處理隨機數(shù)

    這篇文章主要介紹了python標準庫random模塊處理隨機數(shù),random模塊實現(xiàn)了各種分布的偽隨機數(shù)生成器,具體介紹感興趣的小伙伴可以參考一下
    2022-09-09
  • python中print輸出有空格如何解決

    python中print輸出有空格如何解決

    這篇文章主要介紹了python中print輸出有空格的解決方案,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
    2024-02-02
  • Python讀取、寫入txt文本內(nèi)容詳解

    Python讀取、寫入txt文本內(nèi)容詳解

    這篇文章主要介紹了Python讀取、寫入txt文本內(nèi)容詳解,python常用的讀取文件函數(shù)有三種read()、readline()、readlines() ,今天來看一下三種函數(shù)的用法與三者的區(qū)別,需要的朋友可以參考下
    2023-08-08
  • python爬蟲實戰(zhàn)之爬取京東商城實例教程

    python爬蟲實戰(zhàn)之爬取京東商城實例教程

    這篇文章主要介紹了python爬取京東商城的相關資料,文中通過爬取一個實例頁面進行了講解,通過示例代碼和圖文介紹的非常詳細,相信對大家具有一定的參考價值,需要的朋友們下面來一起學習學習吧。
    2017-04-04
  • pyqt 實現(xiàn)在Widgets中顯示圖片和文字的方法

    pyqt 實現(xiàn)在Widgets中顯示圖片和文字的方法

    今天小編就為大家分享一篇pyqt 實現(xiàn)在Widgets中顯示圖片和文字的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-06-06
  • flask-restful使用總結

    flask-restful使用總結

    Flask-RESTful是一個用于快速創(chuàng)建RESTful API接口的Flask擴展。,這篇文章主要介紹了flask-restful使用總結,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2018-12-12
  • Pytorch訓練過程出現(xiàn)nan的解決方式

    Pytorch訓練過程出現(xiàn)nan的解決方式

    今天小編就為大家分享一篇Pytorch訓練過程出現(xiàn)nan的解決方式,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-01-01
  • Go1.16引入目錄遍歷優(yōu)化解析

    Go1.16引入目錄遍歷優(yōu)化解析

    Go1.16版本中,對目錄遍歷進行了顯著的優(yōu)化,新增的接口os.ReadDir、(*os.File).ReadDir和filepath.WalkDir使用fs.DirEntry代替os.FileInfo,減少了系統(tǒng)調(diào)用次數(shù),提高了遍歷效率,測試顯示,優(yōu)化后的遍歷速度比原先快了480%
    2024-10-10
  • python數(shù)字圖像處理之高級形態(tài)學處理

    python數(shù)字圖像處理之高級形態(tài)學處理

    這篇文章主要介紹了python數(shù)字圖像處理之高級形態(tài)學處理,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2018-04-04

最新評論