Python 制作自動(dòng)化翻譯工具
媽媽再也不用擔(dān)心我的英語(yǔ)了。
一個(gè)可能你似曾相識(shí)的場(chǎng)景
閱讀內(nèi)容包含大量英文的 PPT、Word、Excel 或者記事本時(shí),由于英語(yǔ)不熟悉,為了流利地閱讀,需要打開(kāi)瀏覽器進(jìn)入谷歌翻譯的主界面,然后把英文復(fù)制到谷歌翻譯的輸入框中,最后又把翻譯結(jié)果復(fù)制回 PPT、Word 和 Excel。


要是一個(gè)兩個(gè)單詞還好,要是發(fā)現(xiàn)有 100 個(gè)單詞不認(rèn)識(shí),就必須復(fù)制粘貼 200 次,如此機(jī)械性重復(fù)性的工作,應(yīng)該交給程序來(lái)做,這就是我設(shè)計(jì)下面這個(gè)自動(dòng)化翻譯工具的初衷。
提升辦公效率的法寶

如上圖,運(yùn)行程序并保持后臺(tái)運(yùn)行,在電腦上的任何一個(gè)軟件中選擇一段文本,并 Ctrl + C 復(fù)制到系統(tǒng)剪貼板中,程序就會(huì)自動(dòng)幫助我們完成翻譯,并將翻譯結(jié)果自動(dòng)復(fù)制到系統(tǒng)剪貼版中,只需 Ctrl + V,就完成了翻譯結(jié)果對(duì)原文的替換。
編碼實(shí)現(xiàn)
程序主要分為兩部分,第一部分為谷歌翻譯爬蟲(chóng),第二部分就是實(shí)現(xiàn)這個(gè)將翻譯結(jié)果自動(dòng)替換的業(yè)務(wù)邏輯。
谷歌翻譯爬蟲(chóng)
通過(guò)瀏覽器 F12 開(kāi)發(fā)者工具,很容易定位到翻譯請(qǐng)求的 URL: http://translate.google.cn/translate_a/single?client=t&sl=en&tl=zh-CN&hl=zh-CN&dt=at&dt=bd&dt=ex&dt=ld&dt=md&dt=qca&dt=rw&dt=rm&dt=ss &dt=t&ie=UTF-8&oe=UTF-8&clearbtn=1&otf=1&pc=1&srcrom=0&ssel=0&tsel=0&kc=2
這個(gè)請(qǐng)求接受兩個(gè)參數(shù),一個(gè)就是我們要翻譯的字符串 q,另一個(gè)是用于用戶認(rèn)證的 tk(token),其中 q 很容易構(gòu)造,tk 的構(gòu)造就需要花費(fèi)一番心力了,需要我們調(diào)試 js 代碼,這里參考 Github 上大神的輪子: https://github.com/cocoa520/Google_TK
谷歌翻譯爬蟲(chóng)的主要代碼如下:
def translate(tk, content):
if len(content) > 4891:
print("翻譯的長(zhǎng)度超過(guò)限制?。?!")
return
param = {'tk': tk, 'q': content}
result = requests.get("""http://translate.google.cn/translate_a/single?client=t&sl=en
&tl=zh-CN&hl=zh-CN&dt=at&dt=bd&dt=ex&dt=ld&dt=md&dt=qca&dt=rw&dt=rm&dt=ss
&dt=t&ie=UTF-8&oe=UTF-8&clearbtn=1&otf=1&pc=1&srcrom=0&ssel=0&tsel=0&kc=2""", params=param)
data = result.json()
print(data[0][0][0])
返回結(jié)果是 json 形式的,翻譯結(jié)果保存在結(jié)果的第一個(gè)元組中。
Python 操作系統(tǒng)剪貼板
將讀取剪貼板的內(nèi)容的代碼封裝成函數(shù)如下:
def getText():#讀取剪切板
# 打開(kāi)剪貼板
w.OpenClipboard()
# 讀取剪貼板的內(nèi)容
d = w.GetClipboardData(win32con.CF_TEXT)
# 關(guān)閉剪貼板
w.CloseClipboard()
try:
return d.decode('utf-8')
except:
return d.decode('gbk')
返回值 d 是字節(jié)類型的,需要解碼,中文按 gbk 格式解碼,英文按 utf-8 解碼。
類似地,寫(xiě)入剪貼板的代碼如下:
def setText(aString):#寫(xiě)入剪切板
# 打開(kāi)剪貼板
w.OpenClipboard()
# 清空剪貼板
w.EmptyClipboard()
# 寫(xiě)入剪貼板
w.SetClipboardText(aString)
# 關(guān)閉剪貼板
w.CloseClipboard()
實(shí)現(xiàn)將翻譯結(jié)果自動(dòng)替換原文的邏輯的代碼如下:
while(True):
# 如果剪貼板正在被占用
try:
cs = getText()
except:
time.sleep(1)
cs = getText()
print('cs',cs)
if cs and cs != ls:
print('準(zhǔn)備翻譯')
content = getText()
tk = js.getTk(content)
res = translate(tk, content)
setText(res)
time.sleep(1)
ls = res
值得注意的是,系統(tǒng)剪貼板對(duì)象是單例模式的,在操作系統(tǒng)范圍內(nèi)只有一個(gè),而且讀寫(xiě)剪貼板都是互斥的,在讀(寫(xiě))剪貼板的同時(shí)不允許任何對(duì)剪貼板的寫(xiě)(讀)操作。試想這樣一種情景,我們?cè)谄渌浖?Ctrl + C 寫(xiě)入剪貼板,而此時(shí)我們的程序代碼正好執(zhí)行到讀剪貼板那一行,毫無(wú)疑問(wèn)會(huì)報(bào)錯(cuò),我的解決辦法是使用 try…except 語(yǔ)句延時(shí) 1 s再讀取,這樣可以大大降低讀寫(xiě)碰撞的概率,但無(wú)疑消耗了程序性能。最好的辦法是判斷剪貼板對(duì)象句柄是否被占用,其實(shí)我一直在尋找是否存在判斷剪貼板對(duì)象句柄是否被占用的 API,但是一直沒(méi)有找到
項(xiàng)目地址
https://github.com/Python3Spiders/GoogleAutoTranslationTool
以上就是Python 實(shí)現(xiàn)自動(dòng)化翻譯和替換的腳本的詳細(xì)內(nèi)容,更多關(guān)于python 自動(dòng)化翻譯的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
- python 利用PyAutoGUI快速構(gòu)建自動(dòng)化操作腳本
- python 辦公自動(dòng)化——基于pyqt5和openpyxl統(tǒng)計(jì)符合要求的名單
- python辦公自動(dòng)化之excel的操作
- 教你利用Selenium+python自動(dòng)化來(lái)解決pip使用異常
- 十個(gè)Python自動(dòng)化常用操作,即拿即用
- 如何用 Python 子進(jìn)程關(guān)閉 Excel 自動(dòng)化中的彈窗
- python自動(dòng)化之如何利用allure生成測(cè)試報(bào)告
- 教你怎么用Python處理excel實(shí)現(xiàn)自動(dòng)化辦公
- python實(shí)現(xiàn)百度文庫(kù)自動(dòng)化爬取
- Python自動(dòng)化之批量處理工作簿和工作表
相關(guān)文章
python 文件的基本操作 菜中菜功能的實(shí)例代碼
這篇文章主要介紹了python 文件的基本操作 菜中菜功能,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值 ,需要的朋友可以參考下2019-07-07
Django uwsgi Nginx 的生產(chǎn)環(huán)境部署詳解
這篇文章主要介紹了Django uwsgi Nginx 的生產(chǎn)環(huán)境部署詳解,小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2019-02-02
Python3自動(dòng)簽到 定時(shí)任務(wù) 判斷節(jié)假日的實(shí)例
今天小編就為大家分享一篇Python3自動(dòng)簽到 定時(shí)任務(wù) 判斷節(jié)假日的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-11-11
PySpark中RDD的數(shù)據(jù)輸出問(wèn)題詳解
RDD是 Spark 中最基礎(chǔ)的抽象,它表示了一個(gè)可以并行操作的、不可變得、被分區(qū)了的元素集合,這篇文章主要介紹了PySpark中RDD的數(shù)據(jù)輸出詳解,需要的朋友可以參考下2023-01-01
python導(dǎo)入csv文件出現(xiàn)SyntaxError問(wèn)題分析
這篇文章主要介紹了python導(dǎo)入csv文件出現(xiàn)SyntaxError問(wèn)題分析,同時(shí)涉及python導(dǎo)入csv文件的三種方法,具有一定借鑒價(jià)值,需要的朋友可以參考下。2017-12-12
python 利用jinja2模板生成html代碼實(shí)例
這篇文章主要介紹了python 利用jinja2模板生成html代碼實(shí)例,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-10-10
用Python制作簡(jiǎn)單的樸素基數(shù)估計(jì)器的教程
這篇文章主要介紹了用Python制作簡(jiǎn)單的樸素基數(shù)估計(jì)器的教程,同時(shí)介紹了如何去改進(jìn)精度來(lái)進(jìn)行算法優(yōu)化,需要的朋友可以參考下2015-04-04

