完美解決Python2操作中文名文件亂碼的問題
Python2默認(rèn)是不支持中文的,一般我們在程序的開頭加上#-*-coding:utf-8-*-來解決這個問題,但是在我用open()方法打開文件時,中文名字卻顯示成了亂碼。
我先給大家說說Python中的編碼問題,Python中的字符串的大概分為為str和Unicode兩種形式,其中str常用的編碼類型為utf-8,gb2312,gbk等等,Python使用Unicode作為編碼的基礎(chǔ)類型。str記錄的是字節(jié)數(shù)組,只是某種編碼的存儲格式,終于輸出到文件或是打印出來是什么格式,完全取決于其解碼的編碼將他解碼成什么樣子;Unicode是一種類似于符號集的抽象編碼,它只規(guī)定了符號的二進(jìn)制代碼,卻沒有規(guī)定這個二進(jìn)制代碼該如何存儲,也就是它只是一種內(nèi)部表示,不能直接保存,所以存儲時需要規(guī)定一種存儲形式,比如utf-8等。
Python中有編碼轉(zhuǎn)換的函數(shù)有:
decode(char_set) 實現(xiàn)char_set解碼成Unicodeencode(char_set) 實現(xiàn)Unicode編碼成char_set
查看Python文檔會發(fā)現(xiàn):
open(filename, 'w')這個方法中,filename這個參數(shù)必須是Unicode編碼的參數(shù)。
我之前加上#-*-coding:utf-8-*-將編碼設(shè)置為utf-8,當(dāng)調(diào)用這個方法往里傳參數(shù)時,需要將這個變量filename解碼成Unicode。
比如filename='中文.txt',使用open()時,這樣寫open(filename.decode('utf-8'), 'w'),這樣創(chuàng)建的中文文件名就沒有亂碼問題了。
以上就是小編為大家?guī)淼耐昝澜鉀QPython2操作中文名文件亂碼的問題全部內(nèi)容了,希望大家多多支持腳本之家~
相關(guān)文章
python中的property及屬性與特性之間的優(yōu)先權(quán)
這篇文章主要介紹了python中的property及屬性與特性之間的優(yōu)先權(quán),文章圍繞主題展開詳細(xì)的內(nèi)容介紹,具有一定的參考價值,需要的小伙伴可以參考一下2022-07-07Python光學(xué)仿真學(xué)習(xí)處理高斯光束分布圖像
這篇文章主要為大家介紹了Python光學(xué)仿真學(xué)習(xí)之如何處理高斯光束的分布圖像,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步2021-10-10淺談Python3 numpy.ptp()最大值與最小值的差
今天小編就為大家分享一篇淺談Python3 numpy.ptp()最大值與最小值的差,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-08-08