python正則過濾字母、中文、數(shù)字及特殊字符方法詳解
更新時間:2020年02月11日 16:26:15 作者:jlulxg
這篇文章主要介紹了python正則過濾字母、數(shù)字及特殊字符方法詳解,需要的朋友可以參考下
去除數(shù)字,特殊字符,只保留漢字
import re
s = '1123*#$ 中abc國'
str = re.sub('[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘'![\\]^_`{|}~\s]+', "", s)
# 去除不可見字符
str = re.sub('[\001\002\003\004\005\006\007\x08\x09\x0a\x0b\x0c\x0d\x0e\x0f\x10\x11\x12\x13\x14\x15\x16\x17\x18\x19\x1a]+', '', x)
print(str)
# 結(jié)果為:中國
去除特殊字符,只保留漢子,字母、數(shù)字
import re
string = "123我123456abcdefgABCVDFF?/ ,。,.:;:''';'''[]{}()()《》"
print(string)
123我123456abcdefgABCVDFF?/ ,。,.:;:''';'''[]{}()()《》
sub_str = re.sub(u"([^\u4e00-\u9fa5\u0030-\u0039\u0041-\u005a\u0061-\u007a])","",string)
print(sub_str)
123我123456abcdefgABCVDFF
正則表達式說明
| 函數(shù) | 說明 |
| sub(pattern,repl,string) | 把字符串中的所有匹配表達式pattern中的地方替換成repl |
| [^**] | 表示不匹配此字符集中的任何一個字符 |
| \u4e00-\u9fa5 | 漢字的unicode范圍 |
| \u0030-\u0039 | 數(shù)字的unicode范圍 |
| \u0041-\u005a | 大寫字母unicode范圍 |
| \u0061-\u007a | 小寫字母unicode范圍 |
| \uAC00-\uD7AF | 韓文的unicode范圍 |
| \u3040-\u31FF | 日文的unicode范圍 |
更多關(guān)于python正則過濾字母、數(shù)字及特殊字符方法請查看下面相關(guān)鏈接
相關(guān)文章
解決plt.savefig()和plt.show()方法得到的圖片不一樣問題
這篇文章主要介紹了解決plt.savefig()和plt.show()方法得到的圖片不一樣問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2023-08-08
Django框架基礎(chǔ)模板標簽與filter使用方法詳解
這篇文章主要介紹了Django框架基礎(chǔ)模板標簽與filter使用方法,簡單分析了Django模板基本語法、函數(shù)與自定義filter相關(guān)使用技巧,需要的朋友可以參考下2019-07-07
python3常用的數(shù)據(jù)清洗方法(小結(jié))
這篇文章主要介紹了python3常用的數(shù)據(jù)清洗方法(小結(jié)),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2019-10-10
yolov5訓練時參數(shù)workers與batch-size的深入理解
最近再學習YOLOv3與YOLOv5訓練數(shù)據(jù)集的具體步驟,幾經(jīng)波折終于實現(xiàn)了很好的效果,這篇文章主要給大家介紹了關(guān)于yolov5訓練時參數(shù)workers與batch-size的相關(guān)資料,文中通過實例代碼介紹的非常詳細,需要的朋友可以參考下2022-03-03

