python 批量將中文名轉(zhuǎn)換為拼音
有時(shí)在處理文件時(shí)候,我們需要將中文姓名轉(zhuǎn)換為拼音,或者是轉(zhuǎn)換為拼音首字母,本文將介紹三種Python實(shí)現(xiàn)的方法,最后給一個(gè)批量操作的代碼案例!
一、xpinyin
開(kāi)門見(jiàn)山,Python中文字轉(zhuǎn)拼音可以使用xpinyin,直接使用pip安裝即可?
pip install xpinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
接著導(dǎo)入xpinyin下的 Pinyin 方法如下
from xpinyin import Pinyin
首先試試中文名轉(zhuǎn)拼音,
p = Pinyin() result1 = p.get_pinyin('葉伏天') result1
結(jié)果如下:
'ye-fu-tian'
tone_marks
可以顯示聲調(diào)
result2 = p.get_pinyin('葉伏天', tone_marks='marks')
結(jié)果如下:
'yè-fú-tiān'
去掉空格?
s = result1.split('-') result3 = s[0].capitalize() + ' ' + ''.join(s[1:]).capitalize() result3 結(jié)果如下: 'Ye Futian'
有時(shí)需要中文名轉(zhuǎn)拼音首字母,也很簡(jiǎn)單?
二、pypinyin
另一種方法是使用pypinyin,安裝同樣可以使用pip
# 安裝 pip install pypinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
直接導(dǎo)入就行?
import pypinyin
再來(lái)看看中文名轉(zhuǎn)拼音的實(shí)現(xiàn)辦法
result1 = pypinyin.pinyin('葉庭云', style=pypinyin.NORMAL) result1
結(jié)果如下:
[['ye'], ['ting'], ['yun']]
啟用多音節(jié)來(lái)實(shí)現(xiàn)聲調(diào)
result2 = pypinyin.pinyin('葉庭云', heteronym=True) result2
結(jié)果如下:
[['yè', 'xié'], ['tíng'], ['yún']]
因?yàn)榉祷氐氖且粋€(gè)嵌套的list,所以需要簡(jiǎn)單調(diào)整一下
result_ = [i[0] for i in result1] result3 = result_[0].capitalize() + ' ' + ''.join(result_[1:]).capitalize() result3
結(jié)果如下:
'Ye Tingyun'
啟用多音字模式時(shí),竟然發(fā)現(xiàn) ‘葉' 也是多音字,查詢了資料發(fā)現(xiàn)確實(shí)是這樣,漲知識(shí)啦!
下面是中文名轉(zhuǎn)拼音首字母的方法
三、snownlp
最后一種辦法是使用snownlp,同樣的pip安裝與導(dǎo)入如下:
# 安裝 pip install snownlp -i http://pypi.douban.com/simple --trusted-host pypi.douban.com # 導(dǎo)入 from snownlp import SnowNLP
中文名轉(zhuǎn)拼音?
s = SnowNLP('葉庭云') s.pinyin
結(jié)果如下:
['ye', 'ting', 'yun']
將list轉(zhuǎn)為字符串
result4 = s.pinyin[0].capitalize() + ' ' + ''.join(s.pinyin[1:]).capitalize() result4
結(jié)果如下:
'Ye Tingyun'
最后是中文名轉(zhuǎn)拼音首字母
四、批量將中文名轉(zhuǎn)換成拼音
現(xiàn)在,掌握了基本使用后,我們就能利用批量操作來(lái)解放雙手
import pypinyin import pandas as pd df = pd.read_excel('學(xué)生名單_test.xls') df.head()
先導(dǎo)入一份學(xué)生名單如下
下面是使用pypinyin批量將全部學(xué)生的中文姓名轉(zhuǎn)換為拼音
pinyin_name = [] first_pinyin = [] for i in df['姓名']: result = pypinyin.pinyin(i, style=pypinyin.NORMAL) result_ = [i[0] for i in result] result2 = result_[0].capitalize() + ' ' + ''.join(result_[1:]).capitalize() result3 = ''.join([i[0].upper() for i in result_]) print(result2, i, sep=' ') pinyin_name.append(result2) first_pinyin.append(result3) df['英文名'] = pinyin_name df['拼音首字母'] = first_pinyin df.head()
或者是轉(zhuǎn)換為拼音首字母,運(yùn)行結(jié)果如下:
以上就是python 批量將中文名轉(zhuǎn)換為拼音的詳細(xì)內(nèi)容,更多關(guān)于python 中文名轉(zhuǎn)換為拼音的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
- Python 中拼音庫(kù) PyPinyin 用法詳解
- 基于Python第三方插件實(shí)現(xiàn)西游記章節(jié)標(biāo)注漢語(yǔ)拼音的方法
- 利用python實(shí)現(xiàn)漢字轉(zhuǎn)拼音的2種方法
- 用Python從0開(kāi)始實(shí)現(xiàn)一個(gè)中文拼音輸入法的思路詳解
- Python3實(shí)現(xiàn)漢語(yǔ)轉(zhuǎn)換為漢語(yǔ)拼音
- python去除拼音聲調(diào)字母,替換為字母的方法
- Python 獲取中文字拼音首個(gè)字母的方法
- python獲取一組漢字拼音首字母的方法
- Python 返回漢字的漢語(yǔ)拼音
- Python實(shí)現(xiàn)拼音轉(zhuǎn)換
相關(guān)文章
python可迭代類型遍歷過(guò)程中數(shù)據(jù)改變會(huì)不會(huì)報(bào)錯(cuò)
這篇文章主要介紹了python可迭代類型遍歷過(guò)程中數(shù)據(jù)改變會(huì)不會(huì)報(bào)錯(cuò)問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-12-12python實(shí)現(xiàn)自動(dòng)整理文件
這篇文章主要介紹了python實(shí)現(xiàn)自動(dòng)整理文件,主要內(nèi)容通過(guò)整理桌面雜亂無(wú)章都是文檔和資料了解用python如何批量將不同后綴的文件移動(dòng)到同一文件夾,需要的朋友可以參考一下2022-04-04關(guān)于數(shù)據(jù)分析Pandas的Series用法總結(jié)
這篇文章主要介紹了關(guān)于數(shù)據(jù)分析Pandas的Series用法總結(jié),Series序列,是一種一維的結(jié)構(gòu),類似于一維列表和ndarray中的一維數(shù)組,但是功能比他們要更為強(qiáng)大,Series由兩部分組成:索引index和數(shù)值values,本篇對(duì)其用法做出總結(jié)2023-07-07PyTorch 解決Dataset和Dataloader遇到的問(wèn)題
今天小編就為大家分享一篇PyTorch 解決Dataset和Dataloader遇到的問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-01-01用Python刪除本地目錄下某一時(shí)間點(diǎn)之前創(chuàng)建的所有文件的實(shí)例
下面小編就為大家分享一篇用Python刪除本地目錄下某一時(shí)間點(diǎn)之前創(chuàng)建的所有文件的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2017-12-12python爬蟲(chóng)URL重試機(jī)制的實(shí)現(xiàn)方法(python2.7以及python3.5)
今天小編就為大家分享一篇python爬蟲(chóng)URL重試機(jī)制的實(shí)現(xiàn)方法(python2.7以及python3.5),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-12-12使用Python腳本zabbix自定義key監(jiān)控oracle連接狀態(tài)
這篇文章主要介紹了使用Python腳本zabbix自定義key監(jiān)控oracle連接狀態(tài),本文給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2019-08-08如何使用python讀取Excel指定范圍并轉(zhuǎn)為數(shù)組
python處理數(shù)據(jù)文件的途徑有很多種,下面這篇文章主要給大家介紹了關(guān)于如何使用python讀取Excel指定范圍并轉(zhuǎn)為數(shù)組的相關(guān)資料,文中通過(guò)圖文以及實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-11-11python實(shí)現(xiàn)web方式logview的方法
這篇文章主要介紹了python實(shí)現(xiàn)web方式logview的方法,涉及Python基于web模塊操作Linux命令的技巧,具有一定參考借鑒價(jià)值,需要的朋友可以參考下2015-08-08python3.x編碼解碼unicode字符串的實(shí)現(xiàn)示例
ASCII文本編碼是一種Unicode,存儲(chǔ)為表示字符的字節(jié)值的一個(gè)序列,本文主要介紹了python3.x編碼解碼unicode字符串的實(shí)現(xiàn)示例,具有一定的參考價(jià)值,感興趣的可以了解一下2024-01-01