Python判斷中文字符串是否相等的實例
Python判斷兩個相等的中文字符串為false,將兩個待比較的字符串都把unicode編碼設為‘utf-8'也不能解決問題,具體原因如下:
1.首先查看待比較兩個字符串的編碼格式 ,使用命令
import chardet ...... string_code = chardet.detect(string_word)
比較兩個字符串的編碼結果,如下圖所示
一個編碼格式為‘UTF-8-SIG',另一個編碼格式為‘utf-8',兩個字符串的編碼格式不同,所以比較的結果為不相等
出現(xiàn)編碼為‘UTF-8-SIG'是因為文件在存儲的時候以UTF-8格式編碼保存,將文件以UTF-8無BOM格式編碼存儲,則讀取出的數(shù)據(jù)編碼格式自然變?yōu)椤畊tf-8'
2.文件以UTF-8無BOM格式編碼重新存儲,重新比較兩個相等的字符串,返回值為True,即兩個字符串相等
以上這篇Python判斷中文字符串是否相等的實例就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關文章
python基于socket實現(xiàn)的UDP及TCP通訊功能示例
這篇文章主要介紹了python基于socket實現(xiàn)的UDP及TCP通訊功能,結合實例形式分析了基于Python socket模塊的UDP及TCP通信相關客戶端、服務器端實現(xiàn)技巧,需要的朋友可以參考下2019-11-11玩數(shù)據(jù)必備Python庫之numpy使用詳解
NumPy提供了許多高級的數(shù)值編程工具,如矩陣數(shù)據(jù)類型、矢量處理,以及精密的運算庫,下面這篇文章主要給大家介紹了關于玩數(shù)據(jù)必備Python庫之numpy使用的相關資料,需要的朋友可以參考下2022-02-02TensorFlow實現(xiàn)模型斷點訓練,checkpoint模型載入方式
這篇文章主要介紹了TensorFlow實現(xiàn)模型斷點訓練,checkpoint模型載入方式,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-05-05python中DataFrame數(shù)據(jù)合并merge()和concat()方法詳解
Pandas提供了很多合并Series和Dataframe的強大的功能,通過這些功能可以方便的進行數(shù)據(jù)分析,下面這篇文章主要給大家介紹了關于python中DataFrame數(shù)據(jù)合并merge()和concat()方法的相關資料,需要的朋友可以參考下2022-07-07