亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

基于Python實(shí)現(xiàn)簡單的漢字拼音轉(zhuǎn)換工具

 更新時(shí)間:2022年09月05日 09:05:05   作者:Ckend  
將漢字轉(zhuǎn)為拼音,可以用于批量漢字注音、文字排序、拼音檢索文字等常見場景。現(xiàn)在互聯(lián)網(wǎng)上有許多拼音轉(zhuǎn)換工具,基于Python的開源模塊也不少,本文將利用pypinyin模塊制作簡單的漢字拼音轉(zhuǎn)換工具,感興趣的可以了解一下

將漢字轉(zhuǎn)為拼音,可以用于批量漢字注音、文字排序、拼音檢索文字等常見場景。

現(xiàn)在互聯(lián)網(wǎng)上有許多拼音轉(zhuǎn)換工具,基于Python的開源模塊也不少,今天給大家介紹一個(gè)功能特性最多的模塊:  pypinyin ,它支持以下特性:

  • 1. 根據(jù)詞組智能匹配最正確的拼音。
  • 2. 支持多音字。
  • 3. 簡單的繁體支持, 注音支持。
  • 4. 支持多種不同拼音/注音風(fēng)格。
  • 5. 命令行工具一鍵轉(zhuǎn)化

1.準(zhǔn)備

開始之前,你要確保Python和pip已經(jīng)成功安裝在電腦上,如果沒有,可以訪問這篇文章:超詳細(xì)Python安裝指南 進(jìn)行安裝。

(可選1) 如果你用Python的目的是數(shù)據(jù)分析,可以直接安裝Anaconda,它內(nèi)置了Python和pip.

(可選2) 此外,推薦大家用VSCode編輯器,它有許多的優(yōu)點(diǎn)

請選擇以下任一種方式輸入命令安裝依賴

1. Windows 環(huán)境 打開 Cmd (開始-運(yùn)行-CMD)。

2. MacOS 環(huán)境 打開 Terminal (command+空格輸入Terminal)。

3. 如果你用的是 VSCode編輯器 或 Pycharm,可以直接使用界面下方的Terminal.

pip install pypinyin

2.基本使用

最普通的拼音轉(zhuǎn)化方法如下:

# Python實(shí)用寶典
from?pypinyin?import?pinyin, lazy_pinyin, Style
pinyin('中心')
# [['zhōng'], ['xīn']]

識(shí)別多音字:

# Python實(shí)用寶典
from?pypinyin?import?pinyin, lazy_pinyin, Style
pinyin('中心', heteronym=True)?# 啟用多音字模式
# [['zhōng', 'zhòng'], ['xīn']]

設(shè)置輸出風(fēng)格,只識(shí)別首字母:

# Python實(shí)用寶典
from?pypinyin?import?pinyin, lazy_pinyin, Style
pinyin('中心', style=Style.FIRST_LETTER)?# 設(shè)置拼音風(fēng)格
# [['z'], ['x']]

修改音調(diào)輸出位置,在相應(yīng)字母的后面顯示音調(diào),或者拼音的最后顯示音調(diào):

# Python實(shí)用寶典
from?pypinyin?import?pinyin, lazy_pinyin, Style

# TONE2 在相應(yīng)字母的后面顯示音調(diào)
pinyin('中心', style=Style.TONE2, heteronym=True)
# [['zho1ng', 'zho4ng'], ['xi1n']]

# TONE3 拼音的最后顯示音調(diào)
pinyin('中心', style=Style.TONE3, heteronym=True)
# [['zhong1', 'zhong4'], ['xin1']]

不考慮多音字的情況:

# Python實(shí)用寶典
from?pypinyin?import?pinyin, lazy_pinyin, Style
lazy_pinyin('中心')?# 不考慮多音字的情況
# ['zhong', 'xin']

不使用v來代替ü:

# Python實(shí)用寶典
from?pypinyin?import?pinyin, lazy_pinyin, Style
lazy_pinyin('戰(zhàn)略', v_to_u=True)?# 不使用 v 表示 ü
# ['zhan', 'lüe']

標(biāo)記輕聲:

# Python實(shí)用寶典
from?pypinyin?import?pinyin, lazy_pinyin, Style
# 使用 5 標(biāo)識(shí)輕聲
lazy_pinyin('衣裳', style=Style.TONE3, neutral_tone_with_five=True)
# ['yi1', 'shang5']

使用命令行一鍵識(shí)別拼音:

# Python實(shí)用寶典
python -m pypinyin 音樂
# yīn yuè

3.高級(jí)使用

自定義拼音顯示風(fēng)格

我們可以通過 register() 來實(shí)現(xiàn)自定義拼音風(fēng)格的需求:

from?pypinyin?import?lazy_pinyin

from?pypinyin.style?import?register

@register('kiss')
def?kiss(pinyin, **kwargs):
????return?'?? {0}'.format(pinyin)

??
lazy_pinyin('么么', style='kiss')
# ['?? me', '?? me']

可以見到,通過定義一個(gè) kiss 函數(shù),使用 register 裝飾器,我們生成了一個(gè)新的 style,這個(gè) style 可以直接被用于拼音的轉(zhuǎn)換參數(shù),非常方便。

另外,所有模塊自帶的 style 及其效果如下:

@unique
class?Style(IntEnum):
????"""拼音風(fēng)格"""

????#: 普通風(fēng)格,不帶聲調(diào)。如:中國 -> ``zhong guo``
????NORMAL =?0
????#: 標(biāo)準(zhǔn)聲調(diào)風(fēng)格,拼音聲調(diào)在韻母第一個(gè)字母上(默認(rèn)風(fēng)格)。如:中國 -> ``zhōng guó``
????TONE =?1
????#: 聲調(diào)風(fēng)格2,即拼音聲調(diào)在各個(gè)韻母之后,用數(shù)字 [1-4] 進(jìn)行表示。如:中國 -> ``zho1ng guo2``
????TONE2 =?2
????#: 聲調(diào)風(fēng)格3,即拼音聲調(diào)在各個(gè)拼音之后,用數(shù)字 [1-4] 進(jìn)行表示。如:中國 -> ``zhong1 guo2``
????TONE3 =?8
????#: 聲母風(fēng)格,只返回各個(gè)拼音的聲母部分(注:有的拼音沒有聲母,詳見 `#27`_)。如:中國 -> ``zh g``
????INITIALS =?3
????#: 首字母風(fēng)格,只返回拼音的首字母部分。如:中國 -> ``z g``
????FIRST_LETTER =?4
????#: 韻母風(fēng)格,只返回各個(gè)拼音的韻母部分,不帶聲調(diào)。如:中國 -> ``ong uo``
????FINALS =?5
????#: 標(biāo)準(zhǔn)韻母風(fēng)格,帶聲調(diào),聲調(diào)在韻母第一個(gè)字母上。如:中國 -> ``ōng uó``
????FINALS_TONE =?6
????#: 韻母風(fēng)格2,帶聲調(diào),聲調(diào)在各個(gè)韻母之后,用數(shù)字 [1-4] 進(jìn)行表示。如:中國 -> ``o1ng uo2``
????FINALS_TONE2 =?7
????#: 韻母風(fēng)格3,帶聲調(diào),聲調(diào)在各個(gè)拼音之后,用數(shù)字 [1-4] 進(jìn)行表示。如:中國 -> ``ong1 uo2``
????FINALS_TONE3 =?9
????#: 注音風(fēng)格,帶聲調(diào),陰平(第一聲)不標(biāo)。如:中國 -> ``ㄓㄨㄥ ㄍㄨㄛˊ``
????BOPOMOFO =?10
????#: 注音風(fēng)格,僅首字母。如:中國 -> ``ㄓ ㄍ``
????BOPOMOFO_FIRST =?11
????#: 漢語拼音與俄語字母對(duì)照風(fēng)格,聲調(diào)在各個(gè)拼音之后,用數(shù)字 [1-4] 進(jìn)行表示。如:中國 -> ``чжун1 го2``
????CYRILLIC =?12
????#: 漢語拼音與俄語字母對(duì)照風(fēng)格,僅首字母。如:中國 -> ``ч г``
????CYRILLIC_FIRST =?13

處理特殊字符

默認(rèn)情況下,對(duì)于文字中的特殊字符會(huì)不做任何處理,原樣返回:

pinyin('你好☆☆')
# [['nǐ'], ['hǎo'], ['☆☆']]

不過如果你想對(duì)這些特殊字符做處理也是可以的,比如:

ignore  : 忽略該字符

pinyin('你好☆☆', errors='ignore')
# [['nǐ'], ['hǎo']]

errors : 替換為去掉  \u  的 unicode 編碼:

pinyin('你好☆☆', errors='replace')
# [['nǐ'], ['hǎo'], ['26062606']]

callable 對(duì)象  : 提供一個(gè)回調(diào)函數(shù),接受無拼音字符(串)作為參數(shù), 支持的返回值類型:  unicode或 list或 None:

pinyin('你好☆☆', errors=lambda?x:?'star')
# [['nǐ'], ['hǎo'], ['star']]

pinyin('你好☆☆', errors=lambda?x:?None)
# [['nǐ'], ['hǎo']]

返回值類型為 list時(shí),會(huì)自動(dòng) expend list:

pinyin('你好☆☆', errors=lambda?x: ['star'?for?_?in?x])
# [['nǐ'], ['hǎo'], ['star'], ['star']]

# 指定多音字
pinyin('你好☆☆', heteronym=True, errors=lambda?x: [['star',?'☆']?for?_?in?x])
# [['nǐ'], ['hǎo'], ['star', '☆'], ['star', '☆']]

自定義拼音庫

如果你覺得模塊輸出效果不合你意,或者你想做特殊處理,可以通過  load_single_dict() 或  load_phrases_dict()  以自定義拼音庫的方式修正結(jié)果:

from?pypinyin?import?lazy_pinyin, load_phrases_dict, Style, load_single_dict
hans =?'桔子'
lazy_pinyin(hans, style=Style.TONE2)
# ['jie2', 'zi3']
load_phrases_dict({'桔子': [['jú'], ['zǐ']]})?# 增加 "桔子" 詞組
lazy_pinyin(hans, style=Style.TONE2)
# ['ju2', 'zi3']

hans =?'還沒'
lazy_pinyin(hans, style=Style.TONE2)
# ['hua2n', 'me2i']
load_single_dict({ord('還'):?'hái,huán'})?# 調(diào)整 "還" 字的拼音順序
lazy_pinyin('還沒', style=Style.TONE2)
# ['ha2i', 'me2i']

到此這篇關(guān)于基于Python實(shí)現(xiàn)簡單的漢字拼音轉(zhuǎn)換工具的文章就介紹到這了,更多相關(guān)Python漢字拼音轉(zhuǎn)換內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Flask框架單例模式實(shí)現(xiàn)方法詳解

    Flask框架單例模式實(shí)現(xiàn)方法詳解

    這篇文章主要介紹了Flask框架單例模式實(shí)現(xiàn)方法,結(jié)合實(shí)例形式分析了flask框架單例模式的4種實(shí)現(xiàn)方式與相關(guān)操作技巧,需要的朋友可以參考下
    2019-07-07
  • Python 函數(shù)返回值的示例代碼

    Python 函數(shù)返回值的示例代碼

    這篇文章主要介紹了Python 函數(shù)返回值的示例代碼,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-03-03
  • 如何用GAN訓(xùn)練自己的數(shù)據(jù)生成新的圖片

    如何用GAN訓(xùn)練自己的數(shù)據(jù)生成新的圖片

    這篇文章主要介紹了如何用GAN訓(xùn)練自己的數(shù)據(jù)生成新的圖片問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2023-03-03
  • Python異步在非阻塞子進(jìn)程中運(yùn)行命令詳解

    Python異步在非阻塞子進(jìn)程中運(yùn)行命令詳解

    這篇文章主要為大家介紹了Python異步在非阻塞子進(jìn)程中運(yùn)行命令詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2023-03-03
  • 解決usageerror: line magic function "%%time" not found問題

    解決usageerror: line magic function "

    這篇文章主要介紹了解決usageerror: line magic function "%%time" not found問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2023-01-01
  • 教你使用pyqt實(shí)現(xiàn)桌面歌詞功能

    教你使用pyqt實(shí)現(xiàn)桌面歌詞功能

    最近無事看到了電腦桌面又想到了最近入門的pyqt5,所以下面這篇文章主要給大家介紹了關(guān)于如何使用pyqt實(shí)現(xiàn)桌面歌詞功能的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),需要的朋友可以參考下
    2022-07-07
  • 詳解Python中for循環(huán)的定義迭代方法

    詳解Python中for循環(huán)的定義迭代方法

    for循環(huán)用于迭代序列(即列表、元組、字典、集合或字符串)。for 語句的寫法如從對(duì)象開始按順序給變量賦值,元素個(gè)數(shù)重復(fù)這個(gè)過程。對(duì)象可以是列表(數(shù)組)、元組、字符串等。本文將詳細(xì)講解Python中for定義迭代方法詳解,需要的可以了解一下
    2022-04-04
  • 解決python3 整數(shù)數(shù)組轉(zhuǎn)bytes的效率問題

    解決python3 整數(shù)數(shù)組轉(zhuǎn)bytes的效率問題

    這篇文章主要介紹了解決python3 整數(shù)數(shù)組轉(zhuǎn)bytes的效率問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2021-03-03
  • Python繪制散點(diǎn)圖的教程詳解

    Python繪制散點(diǎn)圖的教程詳解

    散點(diǎn)圖是指在回歸分析中,數(shù)據(jù)點(diǎn)在直角坐標(biāo)系平面上的分布圖,散點(diǎn)圖表示因變量隨自變量而變化的大致趨勢,據(jù)此可以選擇合適的函數(shù)對(duì)數(shù)據(jù)點(diǎn)進(jìn)行擬合。本文將用Python繪制散點(diǎn)圖,需要的可以參考一下
    2022-03-03
  • Windows下將Python文件打包成.EXE可執(zhí)行文件的方法

    Windows下將Python文件打包成.EXE可執(zhí)行文件的方法

    這篇文章主要介紹了Windows下將Python文件打包成.EXE可執(zhí)行文件的方法,需要的朋友可以參考下
    2018-08-08

最新評(píng)論