python網(wǎng)絡(luò)爬蟲(chóng)實(shí)現(xiàn)發(fā)送短信驗(yàn)證碼的方法
前言:今天要總結(jié)的是如何用程序來(lái)實(shí)現(xiàn)短信發(fā)送功能。但是呢,可能需要我們調(diào)用一些api接口,我會(huì)詳細(xì)介紹。都是自己學(xué)到的,害怕忘記,所以要總結(jié)一下,讓寫(xiě)博客成為一種堅(jiān)持的信仰。廢話不多說(shuō),我們開(kāi)始吧!
網(wǎng)絡(luò)爬蟲(chóng)實(shí)現(xiàn)發(fā)送短信驗(yàn)證碼
在實(shí)現(xiàn)我們目標(biāo)的功能之前,我們要有自己的思路,否則你沒(méi)有方向,又如何實(shí)現(xiàn)自己的代碼功能呢?
我們要發(fā)送短信,那么我們其實(shí)是需要分析的。我們可以去分析一個(gè)可以發(fā)送短信的網(wǎng)站頁(yè)面。
我們來(lái)到這里如下:

可以看到這是一個(gè)注冊(cè)界面,我們?cè)谧?cè)時(shí)會(huì)被要求需要填寫(xiě)手機(jī)號(hào)碼的·,其實(shí)還有一欄驗(yàn)證碼識(shí)別,像這里打開(kāi)沒(méi)有,那你就填寫(xiě)幾個(gè)號(hào)碼,發(fā)送,多刷新幾次,就可以了。
不為別人添麻煩,我填寫(xiě)自己的號(hào)碼。
多次刷新會(huì)出現(xiàn),不過(guò)要填寫(xiě)不同的手機(jī)號(hào)碼。你們懂的,我們要看到這個(gè)有驗(yàn)證碼的界面。

我們打開(kāi)chrome谷歌抓包工具,也就是郵件檢查即可。我們點(diǎn)擊network直接進(jìn)行抓包,記得在抓包前最好清除下面出現(xiàn)的一切包。我們要點(diǎn)擊驗(yàn)證碼,讓網(wǎng)頁(yè)做出反應(yīng),然后同步一下,進(jìn)行抓包。

當(dāng)我們填寫(xiě)手機(jī)號(hào)以后,我們只要點(diǎn)擊那個(gè)驗(yàn)證碼,然后進(jìn)行抓包如下

看到?jīng)]有,其實(shí)點(diǎn)擊同步瞬間只有一個(gè)數(shù)據(jù)包的,在你做其他的動(dòng)作時(shí),可能會(huì)出現(xiàn)其他的數(shù)據(jù)包,但是與此無(wú)關(guān)。
我們直接點(diǎn)進(jìn)去看

我們看這個(gè)url
https://uc.creditcard.ecitic.com/citiccard/ucweb/newvalicode.do?time=1613969346256
我們打開(kāi)這個(gè)url看看廬山真面目
留意觀察這個(gè)time參數(shù),很明顯是一個(gè)時(shí)間戳參數(shù)
時(shí)間戳參數(shù)又是什么概念呢?這里有必要介紹一下
時(shí)間戳 : 格林威治時(shí)間1970年1月0點(diǎn)0分0秒到目前為止
秒級(jí)時(shí)間戳:10數(shù)字
毫秒級(jí)時(shí)間戳 :13位數(shù)字
微秒級(jí)時(shí)間戳:16位數(shù)字
可以看到這個(gè)time參數(shù)屬于毫秒級(jí)別的時(shí)間戳的。
我們?cè)L問(wèn)這個(gè)見(jiàn)面,每次刷新都會(huì)有不同的驗(yàn)證碼,返回當(dāng)前的時(shí)間。如果我們要獲取當(dāng)前的驗(yàn)證碼,我們需要url,前面的參數(shù)都一樣,只有time,我們需要獲取time時(shí)間。如何獲取呢。
python中有一個(gè)time庫(kù),我們導(dǎo)入,來(lái)看如何使用。
下面展示一些 內(nèi)聯(lián)代碼片。
import time
def get_time() :
" 獲取當(dāng)前的時(shí)間戳"
now_time =str(int(time.time()*1000))#獲取毫秒級(jí)的時(shí)間戳
print('當(dāng)前的時(shí)間戳',now_time)
return now_time
get_time()
來(lái)看運(yùn)行結(jié)果
我們目前可以這樣去做

我們把這個(gè)獲取到的時(shí)間戳參數(shù)加入到url中,我們可以實(shí)現(xiàn)動(dòng)態(tài)的獲取,每次要要獲取這個(gè)二維碼時(shí)就需要指定當(dāng)前的時(shí)間time參數(shù),那我們完全可以這樣來(lái)構(gòu)造這個(gè)url。我們用一個(gè)變量來(lái)接收獲取的時(shí)間戳,然后以字符串的形式加入到time后面。
下面展示一些 內(nèi)聯(lián)代碼片。
import time
def get_time() :
" 獲取當(dāng)前的時(shí)間戳"
now_time =str(int(time.time()*1000))#獲取毫秒級(jí)的時(shí)間戳
print('當(dāng)前的時(shí)間戳',now_time)
return now_time
time_one = get_time()
img_url = 'https://uc.creditcard.ecitic.com/citiccard/ucweb/newvalicode.do?time='+time_one
print(img_url)
我們來(lái)看是否可以獲取到相應(yīng)正確的url

我們點(diǎn)入那個(gè)藍(lán)色的鏈接,來(lái)看有沒(méi)有獲取到這個(gè)驗(yàn)證碼圖片。

測(cè)試證明我們完全是對(duì)的。
下一步我們要做的是實(shí)現(xiàn)代碼的訪問(wèn),獲取并保存這個(gè)驗(yàn)證碼。為什么保存,我們應(yīng)該知道這點(diǎn)知識(shí)。

看這三個(gè)提交欄,很明顯是一個(gè)要提交表單的。提交那就需要post,而post請(qǐng)求呢,就是要提交我們的數(shù)據(jù),及手機(jī)號(hào)碼和圖形驗(yàn)證碼。
當(dāng)我們把數(shù)據(jù)提交上去以后,我們?cè)谑謾C(jī)上就會(huì)收到短信驗(yàn)證碼。我們以此來(lái)實(shí)現(xiàn)發(fā)送短信驗(yàn)證碼的功能。
我們來(lái)保存圖片驗(yàn)證碼
下面展示一些 內(nèi)聯(lián)代碼片。
import time
import requests
def get_time() :
" 獲取當(dāng)前的時(shí)間戳"
now_time =str(int(time.time()*1000))#獲取毫秒級(jí)的時(shí)間戳
print('當(dāng)前的時(shí)間戳',now_time)
return now_time
time_one = get_time()
img_url = 'https://uc.creditcard.ecitic.com/citiccard/ucweb/newvalicode.do?time='+time_one
print(img_url)
headers = {
'User-Agent' :'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.150 Safari/537.36'
}
response = requests.get(url=img_url,headers = headers)
img_data = response.content
with open('yzm.jpg',mode = 'wb') as file :
file.write(img_data)

可以看到在代碼編輯器右邊已經(jīng)出現(xiàn)了保存的圖片。
下一步我們繼續(xù)來(lái)分析這個(gè)手機(jī)號(hào)碼的數(shù)據(jù)和圖片驗(yàn)證碼的數(shù)據(jù)在哪里傳入,又是如何實(shí)現(xiàn)。
我們輸入一個(gè)手機(jī)號(hào)碼,然后輸入圖片驗(yàn)證碼,然后點(diǎn)擊免費(fèi)獲取。此時(shí)再次進(jìn)行抓包,抓包的方法與上文的第一次抓包方法相同。
我們來(lái)看會(huì)出現(xiàn)什么樣的包。

藍(lán)色部分的就是我們尋找的目標(biāo)包。然后我們?nèi)绾稳プ??點(diǎn)擊打開(kāi)查看相應(yīng)的代碼。

看到?jīng)]有post請(qǐng)求,是因該提交表單數(shù)據(jù)的。我們看看下面的表單數(shù)據(jù)
這里你會(huì)發(fā)現(xiàn)有一點(diǎn)不同電話號(hào)碼是直接的數(shù)字,圖片驗(yàn)證碼就需要你來(lái)處理了,因?yàn)槲覀兩衔谋4娴尿?yàn)證碼是圖片,你如何識(shí)別到這圖片驗(yàn)證碼里面額數(shù)據(jù),來(lái)進(jìn)行傳入呢?這里我們還需要一個(gè)網(wǎng)站。
超級(jí)鷹,是用來(lái)識(shí)別驗(yàn)證碼的,其實(shí)我們還是調(diào)用這個(gè)接口。

我們點(diǎn)擊開(kāi)發(fā)文檔,我們是用Python寫(xiě)的代碼。所以我們點(diǎn)擊python的圖標(biāo),來(lái)這里來(lái)查看我們需要的。

在下面找到超級(jí)鷹圖像識(shí)別,然后點(diǎn)擊下載。把里面的api接口的py文件導(dǎo)入到你的python編輯器。我這里是用Pycharm寫(xiě)的。所以直接將解壓出來(lái)的Python文件拖入pycharm。

下面是里面的部分代碼。

這里面做了小小的修改。我們直接來(lái)看這段代碼寫(xiě)了什么。
我來(lái)告訴大家原始的代碼有問(wèn)題,很低級(jí)的問(wèn)題。
#!/usr/bin/env python
# coding:utf-8
import requests
from hashlib import md5
class Chaojiying_Client(object):
def __init__(self, username, password, soft_id):
self.username = username
password = password.encode('utf8')
self.password = md5(password).hexdigest()
self.soft_id = soft_id
self.base_params = {
'user': self.username,
'pass2': self.password,
'softid': self.soft_id,
}
self.headers = {
'Connection': 'Keep-Alive',
'User-Agent': 'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0)',
}
def PostPic(self, im, codetype):
"""
im: 圖片字節(jié)
codetype: 題目類(lèi)型 參考 http://www.chaojiying.com/price.html
"""
params = {
'codetype': codetype,
}
params.update(self.base_params)
files = {'userfile': ('ccc.jpg', im)}
r = requests.post('http://upload.chaojiying.net/Upload/Processing.php', data=params, files=files, headers=self.headers)
return r.json()
def ReportError(self, im_id):
"""
im_id:報(bào)錯(cuò)題目的圖片ID
"""
params = {
'id': im_id,
}
params.update(self.base_params)
r = requests.post('http://upload.chaojiying.net/Upload/ReportError.php', data=params, headers=self.headers)
return r.json()
if __name__ == '__main__':
chaojiying = Chaojiying_Client('超級(jí)鷹用戶名', '超級(jí)鷹用戶名的密碼', '96001') #用戶中心>>軟件ID 生成一個(gè)替換 96001
im = open('a.jpg', 'rb').read() #本地圖片文件路徑 來(lái)替換 a.jpg 有時(shí)WIN系統(tǒng)須要//
print chaojiying.PostPic(im, 1902) #1902 驗(yàn)證碼類(lèi)型 官方網(wǎng)站>>價(jià)格體系 3.4+版 print 后要加()
上面這個(gè)是他的原始接口代碼。就很離譜。分塊來(lái)分析。
def __init__(self, username, password, soft_id):
self.username = username
password = password.encode('utf8')#沒(méi)有縮進(jìn)
self.password = md5(password).hexdigest()
self.soft_id = soft_id
.......
.......
這塊的錯(cuò)誤在哪呢?我這里特意表明突出,上面的原始代碼直接沾到這里并不突出,但是你用編輯器打開(kāi)會(huì)有問(wèn)題的。
if __name__ == '__main__':
chaojiying = Chaojiying_Client('超級(jí)鷹用戶名', '超級(jí)鷹用戶名的密碼', '96001') #用戶中心>>軟件ID 生成一個(gè)替換 96001
im = open('a.jpg', 'rb').read() #本地圖片文件路徑 來(lái)替換 a.jpg 有時(shí)WIN系統(tǒng)須要//
print chaojiying.PostPic(im, 1902) #print沒(méi)有加 () #1902 驗(yàn)證碼類(lèi)型 官方網(wǎng)站>>價(jià)格體系 3.#4+版 print 后要加()
還有一處,在這里,代碼格式都沒(méi)有寫(xiě)對(duì),我這里指出,讀者應(yīng)該可以發(fā)現(xiàn)。這里介意讀者可以去平臺(tái)下載這個(gè)接口,自己去修改。
好,且不在談這些,我們繼續(xù)。我們還是修改部分代碼。
def ReportError(self, im_id):
"""
im_id:報(bào)錯(cuò)題目的圖片ID
"""
params = {
'id': im_id,
}
params.update(self.base_params)
r = requests.post('http://upload.chaojiying.net/Upload/ReportError.php', data=params, headers=self.headers)
return r.json()
if __name__ == '__main__':
chaojiying = Chaojiying_Client('超級(jí)鷹用戶名', '超級(jí)鷹用戶名的密碼', '96001') #用戶中心>>軟件ID 生成一個(gè)替換 96001
im = open('a.jpg', 'rb').read() #本地圖片文件路徑 來(lái)替換 a.jpg 有時(shí)WIN系統(tǒng)須要//
print chaojiying.PostPic(im, 1902) #這是原始的代碼 #1902 驗(yàn)證碼類(lèi)型 官方網(wǎng)站>>價(jià)格體系 3.4+版 print 后要加()
我們可以在這內(nèi)部寫(xiě)一個(gè)方法,我們待會(huì)要調(diào)用這個(gè)代碼接口時(shí),直接調(diào)用這個(gè)方法。
注意我們?cè)陬?lèi)里面添加這樣一部分代碼,就是寫(xiě)一個(gè)方法
def run(self):
chaojiying = Chaojiying_Client(constant.USER_NAME, constant.PASSWORD,
913137) # 用戶中心>>軟件ID 生成一個(gè)替換 96001
im = open('yzm.jpg', 'rb').read() # 本地圖片文件路徑 來(lái)替換 a.jpg 有時(shí)WIN系統(tǒng)須要//
result = chaojiying.PostPic(im, 1004) # 1902 驗(yàn)證碼類(lèi)型 官方網(wǎng)站>>價(jià)格體系 3.4+版 print 后要加()
return result['pic_str']
注意分析這個(gè)接口代碼,里面 chaojiying = Chaojiying_Client(constant.USER_NAME, constant.PASSWORD,913137)
在注釋里面其實(shí)說(shuō)的已經(jīng)很清楚了,這里的constant代表我們要導(dǎo)入的py文件,里面包含你的用戶名,密碼,以及軟件id。
im = open(‘yzm.jpg', ‘rb').read() 打開(kāi)你保存的驗(yàn)證碼文件,上面我們已經(jīng)保存過(guò)。
result = chaojiying.PostPic(im, 1004) 1004代表你的驗(yàn)證碼類(lèi)型。
用戶名和密碼你需要注冊(cè)一下。那么軟件id和驗(yàn)證碼類(lèi)型你該如何確定呢?
這是主頁(yè),請(qǐng)點(diǎn)擊價(jià)格體系

在下面你可以來(lái)判斷你的驗(yàn)證碼類(lèi)型了

我們這里需要登錄進(jìn)入用戶中心

進(jìn)入如下界面

往下拉進(jìn)入軟件id

進(jìn)入后點(diǎn)擊生成一個(gè)軟件id,軟件名稱(chēng)和軟件說(shuō)明可以隨便填寫(xiě)

這樣我們就可以獲得一個(gè)軟件id 。
這個(gè)constant如何編寫(xiě),很簡(jiǎn)單,建立一個(gè)py文件,里面寫(xiě)入
USER_NAME=' …' PASSWORD='… '
然后保存即可。導(dǎo)入py文件到當(dāng)前路勁,然后import即可。
現(xiàn)在我們來(lái)看完整的代碼
接口完整修改后的代碼
import requests
from hashlib import md5
import constant
import constant
class Chaojiying_Client(object):
def __init__(self, username, password, soft_id):
self.username = username
self.password = md5(password.encode('utf8')).hexdigest()
self.soft_id = soft_id
self.base_params = {
'user': self.username,
'pass2': self.password,
'softid': self.soft_id,
}
self.headers = {
'Connection': 'Keep-Alive',
'User-Agent': 'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0)',
}
def PostPic(self, im, codetype):
"""
im: 圖片字節(jié)
codetype: 題目類(lèi)型 參考 http://www.chaojiying.com/price.html
"""
params = {
'codetype': codetype,
}
params.update(self.base_params)
files = {'userfile': ('ccc.jpg', im)}
r = requests.post('http://upload.chaojiying.net/Upload/Processing.php', data=params, files=files,
headers=self.headers)
return r.json()
def ReportError(self, im_id):
"""
im_id:報(bào)錯(cuò)題目的圖片ID
"""
params = {
'id': im_id,
}
params.update(self.base_params)
r = requests.post('http://upload.chaojiying.net/Upload/ReportError.php', data=params, headers=self.headers)
return r.json()
def run(self):
chaojiying = Chaojiying_Client(constant.USER_NAME, constant.PASSWORD,
913137) # 用戶中心>>軟件ID 生成一個(gè)替換 96001
im = open('yzm.jpg', 'rb').read() # 本地圖片文件路徑 來(lái)替換 a.jpg 有時(shí)WIN系統(tǒng)須要//
result = chaojiying.PostPic(im, 1004) # 1902 驗(yàn)證碼類(lèi)型 官方網(wǎng)站>>價(jià)格體系 3.4+版 print 后要加()
return result['pic_str']
if __name__ == '__main__':
chaojiying = Chaojiying_Client(constant.USER_NAME, constant.PASSWORD, 913137) # 用戶中心>>軟件ID 生成一個(gè)替換 96001
im = open('yzm.jpg', 'rb').read() # 本地圖片文件路徑 來(lái)替換 a.jpg 有時(shí)WIN系統(tǒng)須要//
result = chaojiying.PostPic(im, 1004)
print(chaojiying.PostPic(im,1004))# 1902 驗(yàn)證碼類(lèi)型 官方網(wǎng)站>>價(jià)格體系 3.4+版 print 后要加()
主文件代碼,從這里執(zhí)行
import time
import requests
from chaojiying import Chaojiying_Client
import constant
def get_time() :
" 獲取當(dāng)前的時(shí)間戳"
now_time =str(int(time.time()*1000))#獲取毫秒級(jí)的時(shí)間戳
print('當(dāng)前的時(shí)間戳',now_time)
return now_time
time_one = get_time()
img_url = 'https://uc.creditcard.ecitic.com/citiccard/ucweb/newvalicode.do?time='+time_one
print(img_url)
headers = {
'User-Agent' :'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.150 Safari/537.36'
}
response = requests.get(url=img_url,headers = headers)
img_data = response.content
with open('yzm.jpg',mode = 'wb') as file :
file.write(img_data)
print(response)
#驗(yàn)證碼識(shí)別
code = Chaojiying_Client(constant.USER_NAME,constant.PASSWORD,913137).run()
print('識(shí)別出來(lái)的驗(yàn)證碼為',code)
#請(qǐng)求保證同一個(gè)用戶
cookiejar = response.cookies
cookies = cookiejar.get_dict()
print(cookies)
data = {
'phone' :19745678397,
'imgValidCode' : code,
}
time_two = get_time()
code_url = 'https://uc.creditcard.ecitic.com/citiccard/ucweb/getsms.do?×tamp'+time_two
requests_two = requests.post(url=code_url,data= data,headers=headers,cookies=cookies)
print(requests_two.json())
我們來(lái)看運(yùn)行結(jié)果

ok,短信發(fā)送成功
需要注意的是,如果你發(fā)送多次的話,那么會(huì)出現(xiàn)提醒你短信發(fā)送頻率過(guò)高的提示。這是服務(wù)器的響應(yīng)。
我們總結(jié)一下該程序?qū)崿F(xiàn)了發(fā)送驗(yàn)證碼的功能,如果你需要實(shí)現(xiàn)發(fā)送你想要的文本,那么你需要調(diào)用其它的接口。別的就不多說(shuō)了,畢竟爬蟲(chóng)也需要講武德。
到此這篇關(guān)于python網(wǎng)絡(luò)爬蟲(chóng)實(shí)現(xiàn)發(fā)送短信驗(yàn)證碼的方法的文章就介紹到這了,更多相關(guān)python爬蟲(chóng)發(fā)送短信驗(yàn)證碼內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python開(kāi)發(fā)的單詞頻率統(tǒng)計(jì)工具wordsworth使用方法
wordsworth是字母,單詞和n元組頻率分析,用來(lái)分析文件中的單詞出現(xiàn)頻率的工具。2014-06-06
python創(chuàng)建Flask Talisman應(yīng)用程序的步驟詳解
Flask是一個(gè)功能強(qiáng)大的Web框架,主要用于使用Python語(yǔ)言開(kāi)發(fā)有趣的Web應(yīng)用程序,Talisman基本上是一個(gè)Flask擴(kuò)展,用于添加HTTP安全標(biāo)頭我們的Flask應(yīng)用程序易于實(shí)施,本文就給大家講講帶Talisman的Flask安全性,需要的朋友可以參考下2023-09-09
微信小程序前端如何調(diào)用python后端的模型詳解
近期需要開(kāi)發(fā)一個(gè)打分的微信小程序,涉及到與后臺(tái)服務(wù)器的數(shù)據(jù)交互,這篇文章主要給大家介紹了關(guān)于微信小程序前端如何調(diào)用python后端模型的相關(guān)資料,需要的朋友可以參考下2022-04-04
Python正則表達(dá)式匹配日期與時(shí)間的方法
這篇文章主要介紹了Python正則表達(dá)式匹配日期與時(shí)間的方法,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2019-07-07
Python圖像處理之目標(biāo)物體輪廓提取的實(shí)現(xiàn)方法
目標(biāo)物體的輪廓實(shí)質(zhì)是指一系列像素點(diǎn)構(gòu)成,這些點(diǎn)構(gòu)成了一個(gè)有序的點(diǎn)集,這篇文章主要給大家介紹了關(guān)于Python圖像處理之目標(biāo)物體輪廓提取的實(shí)現(xiàn)方法,需要的朋友可以參考下2021-08-08
使用Python建立RNN實(shí)現(xiàn)二進(jìn)制加法的示例代碼
這篇文章主要介紹了使用Python建立RNN實(shí)現(xiàn)二進(jìn)制加法的示例代碼,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-03-03

