詳解Python里使用正則表達式的ASCII模式
ASCII
ASCII(American Standard Code for Information Interchange),是一種單字節(jié)的編碼。計算機世界里一開始只有英文,而單字節(jié)可以表示256個不同的字符,可以表示所有的英文字符和許多的控制符號。不過ASCII只用到了其中的一半(\x80以下),這也是MBCS得以實現(xiàn)的基礎。
目前,基本上都使用python3來開發(fā)了,但是有時為了兼容舊的python2的代碼,在正則表達式里主要是字符串的表示方式不同了,在python3里是使用Unicode來表示字符串和正則表達式,而在python2里是使用ASCII來表示的,所以在python3里怎么樣設置才兼容舊的方式呢?其實可以通過ASCII的標志來解決,如下面的例子:
#python 3.6 #蔡軍生 #http://blog.csdn.net/caimouse/article/details/51749579 # import re text = u'Français złoty Österreich' pattern = r'\w+' ascii_pattern = re.compile(pattern, re.ASCII) unicode_pattern = re.compile(pattern) print('Text :', text) print('Pattern :', pattern) print('ASCII :', list(ascii_pattern.findall(text))) print('Unicode :', list(unicode_pattern.findall(text)))
結(jié)果輸出如下:
Text : Français złoty Österreich Pattern : \w+ ASCII : ['Fran', 'ais', 'z', 'oty', 'sterreich'] Unicode : ['Français', 'złoty', 'Österreich']
總結(jié)
以上所述是小編給大家介紹的詳解Python里使用正則表達式的ASCII模式,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!
相關文章
django2+uwsgi+nginx上線部署到服務器Ubuntu16.04
這篇文章主要介紹了django2+uwsgi+nginx上線部署到服務器Ubuntu16.04,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2018-06-06python 刪除excel表格重復行,數(shù)據(jù)預處理操作
這篇文章主要介紹了python 刪除excel表格重復行,數(shù)據(jù)預處理操作,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-07-07Python?nonlocal關鍵字?與?global?關鍵字解析
這篇文章主要介紹了Python?nonlocal關鍵字?與?global?關鍵字解析,nonlocal關鍵字用來在函數(shù)或其他作用域中使用外層變量,global關鍵字用來在函數(shù)或其他局部作用域中使用全局變量,更多香瓜內(nèi)容需要的小伙伴可以參考一下2022-03-03