Python3 中文文件讀寫方法
字符串在Python內(nèi)部的表示是Unicode編碼,因此,在做編碼轉(zhuǎn)換時,通常需要以Unicode作為中間編碼,即先將其他編碼的字符串解碼(decode)成Unicode,再從Unicode編碼(encode)成另一種編碼。
在新版本的python3中,取消了unicode類型,代替它的是使用unicode字符的字符串類型(str),字符串類型(str)成為基礎(chǔ)類型如下所示,而編碼后的變?yōu)榱俗止?jié)類型(bytes) 但是兩個函數(shù)的使用方法不變:
decode encode bytes ------> str(unicode)------>bytes
u = '中文' #指定字符串類型對象u str = u.encode('gb2312') #以gb2312編碼對u進行編碼,獲得bytes類型對象str u1 = str.decode('gb2312')#以gb2312編碼對字符串str進行解碼,獲得字符串類型對象u1 u2 = str.decode('utf-8')#如果以utf-8的編碼對str進行解碼得到的結(jié)果,將無法還原原來的字符串內(nèi)容
文件讀取問題
假如我們讀取一個文件,文件保存時,使用的編碼格式,決定了我們從文件讀取的內(nèi)容的編碼格式,例如,我們從記事本新建一個文本文件test.txt, 編輯內(nèi)容,保存的時候注意,編碼格式是可以選擇的,例如我們可以選擇gb2312,那么使用python讀取文件內(nèi)容,方式如下:
f = open('test.txt','r') s = f.read() #讀取文件內(nèi)容,如果是不識別的encoding格式(識別的encoding類型跟使用的系統(tǒng)有關(guān)),這里將讀取失敗 '''假設(shè)文件保存時以gb2312編碼保存''' u = s.decode('gb2312') #以文件保存格式對內(nèi)容進行解碼,獲得unicode字符串 '''下面我們就可以對內(nèi)容進行各種編碼的轉(zhuǎn)換了''' str = u.encode('utf-8')#轉(zhuǎn)換為utf-8編碼的字符串str str1 = u.encode('gbk')#轉(zhuǎn)換為gbk編碼的字符串str1 str1 = u.encode('utf-16')#轉(zhuǎn)換為utf-16編碼的字符串str1
codecs進行文件的讀取
python給我們提供了一個包codecs進行文件的讀取,這個包中的open()函數(shù)可以指定編碼的類型:
import codecs f = codecs.open('text.text','r+',encoding='utf-8')#必須事先知道文件的編碼格式,這里文件編碼是使用的utf-8 content = f.read()#如果open時使用的encoding和文件本身的encoding不一致的話,那么這里將將會產(chǎn)生錯誤 f.write('你想要寫入的信息') f.close()
以上這篇Python3 中文文件讀寫方法就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
利用Python如何實現(xiàn)一個小說網(wǎng)站雛形
這篇文章主要給大家介紹了關(guān)于利用Python如何實現(xiàn)一個小說網(wǎng)站雛形的相關(guān)資料,文中通過示例代碼介紹的非常詳細,對大家學習或者使用python具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2018-11-11VSCode中Python環(huán)境配置、創(chuàng)建虛擬環(huán)境及pip的一些常用命令
這篇文章主要給大家介紹了關(guān)于VSCode中Python環(huán)境配置、創(chuàng)建虛擬環(huán)境及pip的一些常用命令,Python環(huán)境的創(chuàng)建是在VSCode中很常見的一個需求,特別是當我們需要開發(fā)或者調(diào)試多個Python項目時,使用虛擬環(huán)境是一種好的方式,需要的朋友可以參考下2023-10-10如何解決安裝包過程中的Requirement already satisfied:問題
這篇文章主要介紹了如何解決安裝包過程中的Requirement already satisfied:問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2023-11-11