腳本之家服務器常用軟件

快捷導航

Python去除字符串中某個字符的多種實現(xiàn)方法

更新時間：2023年08月21日 08:48:54 作者：AllardZhao

這篇文章主要介紹了Python去除字符串中某個字符的多種實現(xiàn)方法,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教

Python去除字符串中某個字符的多種方法

1、如何去掉字符串中不需要的字符？

實際案例：

（1）過濾掉用戶輸入前后多余的空白字符：' nick2008@gmail.com '

（2）過濾某windows下編輯文本中的'\r'：'hello world\r\n'

（3）去掉文本中的unicode組合符號(調音)：u'ní hǎo, chī fàn'（或 èěéēàǎā）

解決方案：

方法1：字符串strip()，lstrip()，rstrip()方法去掉字符串兩端字符。

方法2：刪除單個固定位置的字符，可以使用切片+拼接的方式。

方法3：字符串的replace()替換方法或正則表達式re.sub()刪除任意位置字符。(通用)

方法4：字符串translate()方法，可以同時刪除多種不同字符。

2、代碼演示

# 方法1：strip類的方法
# 去掉字符串兩端的字符
s = '  abc  123   '
'''
str.strip方法介紹：
    strip([chars]) -> string or unicode
    chars不指定默認情況下去掉空白字符(空格，\n，\t，\r)
'''
# 去掉兩端空白，但保留了中間的空白
print(s.strip())
# 只去掉左端的空白
print(s.lstrip())
# 只去掉右端的空白
print(s.rstrip())
s2 = '---abc+++'
# 去掉s2中的加減
print(s2.strip('-+'))
# 方法2：刪除固定位置字符，切片+拼接
s3 = 'abc:123'
# 只刪除固定位置的冒號
s4 = s3[0:3] + s3[4:]
print(s4)
# 方法3：
'''
因為第1種方法不能刪除中間的某些字符，只能在兩端進行刪除，
第3種就能完成刪除中間某些字符的事情。
'''
s5 = '\tabc\t123\txyz'
# 清除s5中的所有\(zhòng)t，可以使用字符串替換replace,
# 但是這種方式只能替換一種
print(s5.replace('\t', ''))
s6 = '\tabc\t123\txyz\ropq\r'
import re
# 去除s6中的\t和\r
print(re.sub('[\t\r]', '', s6))
# 方法4：
'''
str.translate方法介紹：
    S.translate(table) -> string
    table如果是None不做任何映射，如果存在就是一個字符映射到另一個字符上去的表；
'''
s7 = 'abc1230323xyz'
# 現(xiàn)在對s7字符串進行加密，加密規(guī)則是將其中a全部替換成x,
# b替換成y,c替換成z,反過來將其中的xyz分別替換成abc
# 構建映射表
make = str.maketrans('abcxyz', 'xyzabc')
print(make)
# 對s7字符串進行加密轉換
print(s7.translate(make))
s8 = 'abc\refg\n2342\t'
# 刪除s8中\(zhòng)r，\n，\t，構建映射表str_trans
str_trans = str.maketrans('', '', '\t\r\n')
print(s8.translate(str_trans))
# 去掉音標符號
u = u'nǐ hǎo, chī fàn'
import unicodedata, sys
# 將原始輸入標準化為分解形式字符
a = unicodedata.normalize('NFD', u)
'''
使用dict.fromkeys() 方法構造一個字典，每個Unicode和音調作為鍵，對應的值全部為None
sys.maxunicode : 給出最大Unicode代碼點的值的整數(shù)，即1114111（十六進制的0x10FFFF）。
unicodedata.combining:將分配給字符chr的規(guī)范組合類作為整數(shù)返回。如果未定義組合類，則返回0
這樣我們就成功將所有組合類的值全部設置為None
'''
cmb_chrs = dict.fromkeys(c for c in range(sys.maxunicode) 
                         if unicodedata.combining(chr(c)))
# 調用translate函數(shù)刪除所有音調
print(a.translate(cmb_chrs))

Python去除字符串兩端字符串

Python中的strip用于去除字符串的首位字符，同理，lstrip用于去除左邊的字符，rstrip用于去除右邊的字符。這三個函數(shù)都可傳入一個參數(shù)，指定要去除的首尾字符。

NOTE：傳入的是一個字符數(shù)組，編譯器去除兩端所有相應的字符，直到?jīng)]有匹配的字符。

這里對這幾個函數(shù)做一個小小的延伸：

1.去除字符串兩端相同的子串：str2.lstrip(str1), str2.rstrip(str1), str2.strip(str1)

例如：

>>> str2='xyz12345xyz'
>>> print(str2.lstrip('xyz')+'|'+str2.rstrip('xyz')+'|'+str2.strip('xyz'))
12345xyz|xyz12345|12345

2.另外要去除的子串也可以用正則表達式來寫，從而去除某一類型的字串：

例如：去除兩端的數(shù)字

'''
遇到問題沒人解答？小編創(chuàng)建了一個Python學習交流QQ群：579817333?
尋找有志同道合的小伙伴，互幫互助,群里還有不錯的視頻學習教程和PDF電子書！
'''
>>> ss = '123woshi233'
>>> ss.strip('[123456789]')
'woshi'

另外：replace函數(shù)也具有去除字符串中某個元素的功能。但是strip()可以同時去掉多個元素：如：

str = "abcdef"
x=str.strip(str[0]+str[-1]+str[-2])
print(x)

總結

以上為個人經(jīng)驗，希望能給大家一個參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python去除字符串中某個字符的多種實現(xiàn)方法

目錄

Python去除字符串中某個字符的多種方法

1、如何去掉字符串中不需要的字符？

2、代碼演示

Python去除字符串兩端字符串

總結

相關文章

最新評論

大家感興趣的內容

最近更新的內容

常用在線小工具

亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python去除字符串中某個字符的多種實現(xiàn)方法

目錄

Python去除字符串中某個字符的多種方法

1、如何去掉字符串中不需要的字符？

2、代碼演示

Python去除字符串兩端字符串

總結

相關文章

最新評論

大家感興趣的內容

最近更新的內容

常用在線小工具

1、如何去掉字符串中不需要的字符？

2、代碼演示