python如何實現(xiàn)全角半角的相互轉(zhuǎn)換
更新時間:2023年11月08日 09:34:20 作者:西奧斯
這篇文章主要介紹了python如何實現(xiàn)全角半角的相互轉(zhuǎn)換方式,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
轉(zhuǎn)換說明
全角半角轉(zhuǎn)換說明
有規(guī)律(不含空格):
- 全角字符unicode編碼從65281~65374 (十六進制 0xFF01 ~ 0xFF5E)
- 半角字符unicode編碼從33~126 (十六進制 0x21~ 0x7E)
特例
空格比較特殊,全角為 12288(0x3000),半角為 32(0x20)
# 正則直接把全角空格替換為半角空格
text2 = re.sub('\s+', ' ', str1)除空格外,全角/半角按unicode編碼排序在順序上是對應的(半角 + 0x7e= 全角),所以可以直接通過用+-法來處理非空格數(shù)據(jù),對空格單獨處理。
注:
- 中文文字永遠是全角,只有英文字母、數(shù)字鍵、符號鍵才有全角半角的概念,
- 一個字母或數(shù)字占一個漢字的位置叫全角,占半個漢字的位置叫半角。
字符串整個替換
def strQ2B(ustring):
"""全角轉(zhuǎn)半角"""
rstring = ""
for uchar in ustring:
inside_code = ord(uchar)
print(inside_code)
if inside_code == 12288: # 全角空格直接轉(zhuǎn)換
inside_code = 32
elif 65281 <= inside_code <= 65374: # 全角字符(除空格)根據(jù)關(guān)系轉(zhuǎn)化
inside_code -= 65248
rstring += unichr(inside_code)
return rstring
def strB2Q(ustring):
"""半角轉(zhuǎn)全角"""
rstring = ""
for uchar in ustring:
inside_code = ord(uchar)
if inside_code == 32: # 半角空格直接轉(zhuǎn)化
inside_code = 12288
elif 32 <= inside_code <= 126: # 半角字符(除空格)根據(jù)關(guān)系轉(zhuǎn)化
inside_code += 65248
rstring += unichr(inside_code)
return rstring總結(jié)
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python利用ORM控制MongoDB(MongoEngine)的步驟全紀錄
MongoEngine是一個對象文檔映射器(ODM),相當于一個基于SQL的對象關(guān)系映射器(ORM),下面這篇文章主要給大家介紹了關(guān)于Python利用ORM控制MongoDB(MongoEngine)的相關(guān)資料,需要的朋友可以參考下2018-09-09
使用Python編程分析火爆全網(wǎng)的魷魚游戲豆瓣影評
本文來為大家介紹如何使用Python爬取影評的操作,主要是爬取《魷魚游戲》在豆瓣上的一些影評,對數(shù)據(jù)做一些簡單的分析,用數(shù)據(jù)的角度重新審視下這部劇,有需要的朋友可以借鑒參考下2021-10-10
解決Keras的自定義lambda層去reshape張量時model保存出錯問題
這篇文章主要介紹了解決Keras的自定義lambda層去reshape張量時model保存出錯問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-07-07

