Python爬蟲如何應(yīng)對Cloudflare郵箱加密
最近寫一個(gè)小爬蟲,需要拿到郵箱信息,發(fā)現(xiàn)拿不到,也不是ajax接口。最后查資料發(fā)現(xiàn)是被Cloudflare加密起來了,有加密肯定有解密。
通過大佬http://chabaoo.cn/article/189404.htm得到了加密算法。
參考大佬的原話搞起來就好:
檸之漠然:
這個(gè)解密方式就是從那段 js 代碼轉(zhuǎn)換過來的
其中最主要的一句話
for (e = ”, r = ‘0x' + a.substr(0, 2) | 0, n = 2; a.length – n; n += 2) e += ‘%' + (‘0' + (‘0x' + a.substr(n, 2) ^ r).toString(16)).slice( – 2);
前面的 2 位數(shù)字轉(zhuǎn)化成 16 進(jìn)制之后就是秘鑰, 接下來的每兩位字符跟秘鑰異或操作之后轉(zhuǎn)成16進(jìn)制, 然后轉(zhuǎn)換成字符
最后將所有解出來的字符拼成一起, 就得到郵箱 abc@abc.com 了
js 這邊是用 urlencode 的方式
下面是復(fù)現(xiàn)的js解密代碼:
function jiemi(val) { for (e = '', r = '0x' + val.substr(0, 2) | 0, n = 2; val.length - n; n += 2) e += '%' + ('0' + ('0x' + val.substr(n, 2) ^ r).toString(16)).slice(-2); return decodeURIComponent(e) }
然后通過python調(diào)用js完美搞定:
import execjs def get_js(): # f = open("./../js/my.js", 'r', encoding='utf-8') # 打開JS文件 f = open("./jiemi.js", 'r', encoding='utf-8') # 打開JS文件 line = f.readline() htmlstr = '' while line: htmlstr = htmlstr+line line = f.readline() return htmlstr def get_des_psswd(e): js_str = get_js() ctx = execjs.compile(js_str) #加載JS文件 return (ctx.call('jiemi', e)) #調(diào)用js方法 第一個(gè)參數(shù)是JS的方法名,后面的data和key是js方法的參數(shù) if __name__ == '__main__': print(get_des_psswd(e='30515253705152531e535f5d'))
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
Python實(shí)現(xiàn)的數(shù)據(jù)結(jié)構(gòu)與算法之雙端隊(duì)列詳解
這篇文章主要介紹了Python實(shí)現(xiàn)的數(shù)據(jù)結(jié)構(gòu)與算法之雙端隊(duì)列,詳細(xì)講述了雙端隊(duì)列的概念、功能、定義及Python實(shí)現(xiàn)與使用雙端隊(duì)列的相關(guān)技巧,非常具有實(shí)用價(jià)值,需要的朋友可以參考下2015-04-04詳解K-means算法在Python中的實(shí)現(xiàn)
這篇文章主要介紹了詳解K-means算法在Python中的實(shí)現(xiàn),具有一定借鑒價(jià)值,需要的朋友可以了解下。2017-12-12Pycharm使用時(shí)會(huì)出現(xiàn)的問題之cv2無法安裝解決
這篇文章主要介紹了Pycharm使用時(shí)會(huì)出現(xiàn)的問題之cv2無法安裝解決方案,具有很好的參考價(jià)值,希望對大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-05-05PyCharm連接遠(yuǎn)程服務(wù)器的超級詳細(xì)教程
Pycharm可以與服務(wù)器建立連接,把相應(yīng)的項(xiàng)目同步到服務(wù)器上,下面這篇文章主要給大家介紹了關(guān)于PyCharm連接遠(yuǎn)程服務(wù)器的超級詳細(xì)教程,文中通過圖文介紹的非常詳細(xì),需要的朋友可以參考下2022-12-12Python與Node.js之間實(shí)現(xiàn)通信的JSON數(shù)據(jù)接收發(fā)送
Python和Node.js是兩個(gè)流行且功能強(qiáng)大的編程語言,它們之間使用JSON格式進(jìn)行數(shù)據(jù)交換是一種高效和靈活的方式,本文將詳細(xì)介紹如何在Python和Node.js之間通過JSON進(jìn)行數(shù)據(jù)通信,包括發(fā)送和接收J(rèn)SON數(shù)據(jù)以及一些常見的交互示例代碼2024-01-01python實(shí)現(xiàn)圖書借閱系統(tǒng)
這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)圖書借閱系統(tǒng),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-02-02Python的凈值數(shù)據(jù)接口調(diào)用示例分享
這篇文章主要介紹了Python的凈值數(shù)據(jù)接口調(diào)用示例分享的相關(guān)資料,需要的朋友可以參考下2016-03-03