教你使用Python pypinyin庫(kù)實(shí)現(xiàn)漢字轉(zhuǎn)拼音
一、前言
這里我先為大家提供一個(gè)中文網(wǎng)站,大家可以下去更深入的學(xué)習(xí)。
https://pypi.org/project/pypinyin/
pypinyin庫(kù),主要有幾下幾個(gè)特性:
- 智能匹配最正確的拼音;
- 支持多音字、繁體字;
- 支持多種不同拼音、注音風(fēng)格;
該庫(kù)屬于第三方Python庫(kù),因此在使用之前,需要提前安裝。
pip install pypinyin
然后,導(dǎo)入該庫(kù)即可。
import pypinyin from pypinyin import pinyin
二、pypinyin庫(kù)的使用
先來(lái)看一個(gè)最基本的例子。
from pypinyin import pinyin
pinyin("吃飯")
結(jié)果如下:

有些字,可能是多音字,再看下面這個(gè)例子。
from pypinyin import pinyin
pinyin('馮',heteronym=True)
pinyin('朝',heteronym=True)
pinyin('同',heteronym=True)
結(jié)果如下:

仔細(xì)觀察上述打印結(jié)果,生成的都是二維列表嵌套,這樣解析起來(lái),真費(fèi)勁!
能不能生成一維列表呢?
from pypinyin import lazy_pinyin
lazy_pinyin("數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)之美")
結(jié)果如下:

問(wèn)題又來(lái)了!
這里雖然是一維列表,但是沒(méi)有聲調(diào)了,這不尷尬了嗎?
這里面就涉及到一個(gè)風(fēng)格轉(zhuǎn)換的問(wèn)題了。
from pypinyin import lazy_pinyin,Style
lazy_pinyin("數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)之美",style=Style.TONE)
結(jié)果如下:

原來(lái)這里有一個(gè)Style類,供我們選擇風(fēng)格,常用的風(fēng)格有下面這14種。
#: 普通風(fēng)格,不帶聲調(diào)。如: 中國(guó) -> ``zhong guo`` NORMAL = 0 #: 標(biāo)準(zhǔn)聲調(diào)風(fēng)格,拼音聲調(diào)在韻母第一個(gè)字母上(默認(rèn)風(fēng)格)。如: 中國(guó) -> ``zhōng guó`` TONE = 1 #: 聲調(diào)風(fēng)格2,即拼音聲調(diào)在各個(gè)韻母之后,用數(shù)字 [1-4] 進(jìn)行表示。如: 中國(guó) -> ``zho1ng guo2`` TONE2 = 2 #: 聲調(diào)風(fēng)格3,即拼音聲調(diào)在各個(gè)拼音之后,用數(shù)字 [1-4] 進(jìn)行表示。如: 中國(guó) -> ``zhong1 guo2`` TONE3 = 8 #: 聲母風(fēng)格,只返回各個(gè)拼音的聲母部分(注:有的拼音沒(méi)有聲母,詳見(jiàn) `#27`_)。如: 中國(guó) -> ``zh g`` INITIALS = 3 #: 首字母風(fēng)格,只返回拼音的首字母部分。如: 中國(guó) -> ``z g`` FIRST_LETTER = 4 #: 韻母風(fēng)格,只返回各個(gè)拼音的韻母部分,不帶聲調(diào)。如: 中國(guó) -> ``ong uo`` FINALS = 5 #: 標(biāo)準(zhǔn)韻母風(fēng)格,帶聲調(diào),聲調(diào)在韻母第一個(gè)字母上。如:中國(guó) -> ``ōng uó`` FINALS_TONE = 6 #: 韻母風(fēng)格2,帶聲調(diào),聲調(diào)在各個(gè)韻母之后,用數(shù)字 [1-4] 進(jìn)行表示。如: 中國(guó) -> ``o1ng uo2`` FINALS_TONE2 = 7 #: 韻母風(fēng)格3,帶聲調(diào),聲調(diào)在各個(gè)拼音之后,用數(shù)字 [1-4] 進(jìn)行表示。如: 中國(guó) -> ``ong1 uo2`` FINALS_TONE3 = 9 #: 注音風(fēng)格,帶聲調(diào),陰平(第一聲)不標(biāo)。如: 中國(guó) -> ``ㄓㄨㄥ ㄍㄨㄛˊ`` BOPOMOFO = 10 #: 注音風(fēng)格,僅首字母。如: 中國(guó) -> ``ㄓ ㄍ`` BOPOMOFO_FIRST = 11 #: 漢語(yǔ)拼音與俄語(yǔ)字母對(duì)照風(fēng)格,聲調(diào)在各個(gè)拼音之后,用數(shù)字 [1-4] 進(jìn)行表示。如: 中國(guó) -> ``чжун1 го2`` CYRILLIC = 12 #: 漢語(yǔ)拼音與俄語(yǔ)字母對(duì)照風(fēng)格,僅首字母。如: 中國(guó) -> ``ч г`` CYRILLIC_FIRST = 13
如果你的文字中,除了漢字,還有其它符號(hào)以及英文,會(huì)打印出怎么樣的效果呢?
from pypinyin import lazy_pinyin
lazy_pinyin('Hello,我是😀',style=Style.TONE)
結(jié)果如下:

漢字打印出來(lái)就行,英文、表情符號(hào)不用打印出來(lái)最好,應(yīng)該怎么辦呢?
這里有一個(gè)errors參數(shù)呢,來(lái)看看例子。
from pypinyin import lazy_pinyin
lazy_pinyin('Hello,我是😀',style=Style.TONE,errors='ignore')
結(jié)果如下:

如果你對(duì)pypinyin庫(kù)的返回結(jié)果不滿意,可以自定義一個(gè)庫(kù)呀!這里可以使用load_phrases_dict 方法。
我們先來(lái)看一個(gè)例子:
from pypinyin import lazy_pinyin
lazy_pinyin("黃同學(xué)",style=Style.TONE)
結(jié)果如下:

“黃同學(xué)” 的同,明明是二聲,這里成了四聲。
from pypinyin import lazy_pinyin, load_phrases_dict
personalized_dict = {'黃同學(xué)': [['huáng'], ['tòng'], ['xué']]}
load_phrases_dict(personalized_dict)
lazy_pinyin("黃同學(xué)",style=Style.TONE)
結(jié)果如下:

到此這篇關(guān)于教你使用Python pypinyin庫(kù)實(shí)現(xiàn)漢字轉(zhuǎn)拼音的文章就介紹到這了,更多相關(guān)Python pypinyin庫(kù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- Python使用pypinyin實(shí)現(xiàn)中文拼音轉(zhuǎn)換
- Python pypinyin注音庫(kù)輕松絲滑實(shí)現(xiàn)漢字轉(zhuǎn)換成拼音
- Python 中拼音庫(kù) PyPinyin 用法詳解
- python中使用xlrd、xlwt操作excel表格詳解
- Python使用xlwt模塊操作Excel的方法詳解
- Python xlwt設(shè)置excel單元格字體及格式
- Python第三方庫(kù)xlrd/xlwt的安裝與讀寫(xiě)Excel表格
- Python漢字轉(zhuǎn)拼音pypinyin庫(kù)、輸出excel的xlwt庫(kù)
相關(guān)文章
Python進(jìn)階之高級(jí)用法詳細(xì)總結(jié)
今天帶各位小伙伴學(xué)習(xí)一下Python高級(jí)語(yǔ)法,主要有Lambda表達(dá)式,map函數(shù),filter函數(shù),reduce函數(shù),三大推導(dǎo)式等,文中有非常詳細(xì)的介紹,需要的朋友可以參考下2021-05-05
跟老齊學(xué)Python之再深點(diǎn),更懂list
對(duì)于list,由于她的確非常非常龐雜,在python中應(yīng)用非常廣泛,所以,雖然已經(jīng)介紹完畢了基礎(chǔ)內(nèi)容,這里還要用一講深入一點(diǎn)點(diǎn),往往越深入越...2014-09-09
pycharm 在debug循環(huán)時(shí)快速debug到指定循環(huán)次數(shù)的操作方法
在 PyCharm 中,可以使用條件斷點(diǎn)來(lái)實(shí)現(xiàn)在特定循環(huán)次數(shù)后停止調(diào)試,本文重點(diǎn)介紹pycharm 在debug循環(huán)時(shí)快速debug到指定循環(huán)次數(shù)的操作方法,需要的朋友可以參考下2024-04-04
Python寫(xiě)UI自動(dòng)化之playwright(點(diǎn)擊操作)詳解
這篇文章主要介紹了Playwright庫(kù)中click()方法的參數(shù)及其使用場(chǎng)景,包括選擇器、修飾鍵、點(diǎn)擊位置、鼠標(biāo)按鈕、點(diǎn)擊次數(shù)、延遲、超時(shí)、強(qiáng)制點(diǎn)擊、試點(diǎn)擊和不等待導(dǎo)航等選項(xiàng),文中通過(guò)代碼介紹的非常詳細(xì),需要的朋友可以參考下2025-02-02
python實(shí)現(xiàn)書(shū)法碑帖圖片分割
這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)書(shū)法碑帖圖片分割,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-03-03
Opencv常見(jiàn)圖像格式Data Type及代碼實(shí)例
這篇文章主要介紹了Opencv常見(jiàn)圖像格式Data Type及代碼實(shí)例,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-11-11
python實(shí)現(xiàn)向ppt文件里插入新幻燈片頁(yè)面的方法
這篇文章主要介紹了python實(shí)現(xiàn)向ppt文件里插入新幻燈片頁(yè)面的方法,涉及Python操作ppt文檔添加幻燈片的相關(guān)技巧,非常具有實(shí)用價(jià)值,需要的朋友可以參考下2015-04-04
numpy系列之?dāng)?shù)組重塑的實(shí)現(xiàn)
本文主要介紹了numpy數(shù)組重塑。所謂數(shù)組重塑就是更改數(shù)組的形狀,文中通過(guò)示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-09-09

