Python中網(wǎng)絡(luò)請(qǐng)求的12種方式
1. 使用requests模塊的基礎(chǔ)請(qǐng)求
import requests;
response = requests.get('https://api.example.com/data')這是最基本的網(wǎng)絡(luò)請(qǐng)求,用requests.get()函數(shù)向指定URL發(fā)送GET請(qǐng)求,response里裝的就是響應(yīng)數(shù)據(jù)。
2. GET請(qǐng)求帶參數(shù)
params = {'key': 'value'};
response = requests.get('https://example.com/search', params=params)通過(guò)字典params傳遞查詢(xún)參數(shù),簡(jiǎn)單又高效。
3. POST請(qǐng)求發(fā)送數(shù)據(jù)
data = {'username': 'learner'};
response = requests.post('https://example.com/login', data=data)POST請(qǐng)求常用于提交數(shù)據(jù),比如登錄表單,這里用data字典攜帶你的信息。
4. 設(shè)置請(qǐng)求頭
headers = {'User-Agent': 'MyBot/0.1'};
response = requests.get('https://example.com', headers=headers)模擬瀏覽器或添加特定的請(qǐng)求頭,有時(shí)候是訪問(wèn)某些網(wǎng)站的關(guān)鍵。
5. 處理JSON響應(yīng)
response = requests.get('https://api.example.com/data');
print(response.json())直接用.json()方法解析JSON格式的響應(yīng),方便快捷。
6. 下載文件
with open('image.jpg', 'wb')
as f: f.write(requests.get('https://example.com/image.jpg', stream=True).content)流式下載大文件,避免內(nèi)存爆棚,記得以二進(jìn)制模式打開(kāi)文件哦。
7. 超時(shí)設(shè)置
response = requests.get('https://slow.example.com', timeout=3)耐心有限,3秒內(nèi)沒(méi)響應(yīng)就放棄,避免程序掛起。
8. 使用代理
proxies = {'http': 'http://proxy.example.com:8080', 'https': 'https://proxy.example.com:8080'}; response = requests.get('https://example.com', proxies=proxies)當(dāng)你需要通過(guò)代理服務(wù)器訪問(wèn)時(shí),這個(gè)技巧很實(shí)用。
9. 自動(dòng)處理重定向
response = requests.get('https://redirect-me.example.com', allow_redirects=False)默認(rèn)情況下會(huì)自動(dòng)重定向,加allow_redirects=False可以控制是否跟隨重定向。
10. 發(fā)送認(rèn)證信息
response = requests.get('https://protected.example.com', auth=('user', 'pass'))問(wèn)需要認(rèn)證的頁(yè)面,用戶(hù)名密碼一提交,輕松搞定。
11. 會(huì)話(huà)管理(保持Cookie)
with requests.Session() as s:
s.get('https://login.example.com')
response = s.get('https://profile.example.com')使用Session對(duì)象,可以維持登錄狀態(tài),訪問(wèn)受限資源。
12. 錯(cuò)誤處理
try:
response = requests.get('https://never.exists.com')
except requests.exceptions.RequestException as e:
print(e)優(yōu)雅地處理請(qǐng)求過(guò)程中可能遇到的錯(cuò)誤,讓你的程序更加健壯。
實(shí)戰(zhàn)案例:網(wǎng)頁(yè)內(nèi)容抓取
想象一下,你想從一個(gè)博客網(wǎng)站上抓取最新的文章標(biāo)題。假設(shè)這個(gè)網(wǎng)站的每篇文章鏈接都在一個(gè)類(lèi)名為'article-title'的HTML元素中。你可以這樣做:
from bs4 import BeautifulSoup; import requests url = 'https://example-blog.com/latest' response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') titles = [title.text for title in soup.find_all(class_='article-title')] print(titles)
這段代碼首先發(fā)送GET請(qǐng)求獲取網(wǎng)頁(yè)內(nèi)容,然后使用BeautifulSoup解析HTML,最后通過(guò)列表推導(dǎo)式提取所有文章標(biāo)題。這就是一個(gè)簡(jiǎn)單的網(wǎng)絡(luò)爬蟲(chóng)雛形。
練習(xí)技巧與方法提示
分步調(diào)試:在復(fù)雜的請(qǐng)求邏輯中,分步執(zhí)行并打印中間結(jié)果,有助于理解流程。
**使用
requests.Session**:在頻繁請(qǐng)求同一站點(diǎn)時(shí),使用Session可以提高效率,減少握手時(shí)間。錯(cuò)誤日志:記錄請(qǐng)求過(guò)程中的錯(cuò)誤,有助于排查問(wèn)題。可以使用Python的logging模塊。
注意事項(xiàng)
遵守Robots協(xié)議(robots.txt):尊重網(wǎng)站規(guī)則,不爬取禁止抓取的內(nèi)容。
請(qǐng)求頻率:合理控制請(qǐng)求間隔,避免對(duì)目標(biāo)網(wǎng)站造成過(guò)大壓力,可能導(dǎo)致IP被封禁。
數(shù)據(jù)處理:獲取的數(shù)據(jù)可能需要清洗和格式化,確保數(shù)據(jù)質(zhì)量。
安全性:在處理HTTP請(qǐng)求時(shí),注意SSL證書(shū)驗(yàn)證,防止中間人攻擊。
高級(jí)技巧:異步請(qǐng)求
隨著Python的asyncio庫(kù)的普及,異步請(qǐng)求成為提高效率的新方式。雖然不是“一行代碼”,但了解其重要性是必要的。
import aiohttp
import asyncio
async def fetch(session, url):
async with session.get(url) as response:
return await response.text()
async def main():
async with aiohttp.ClientSession() as session:
html = await fetch(session, 'https://example.com')
print(html)
loop = asyncio.get_event_loop()
loop.run_until_complete(main())這段代碼展示了如何使用aiohttp庫(kù)進(jìn)行異步HTTP請(qǐng)求,大幅提升了并發(fā)請(qǐng)求的能力,適用于大量請(qǐng)求的場(chǎng)景。
以上就是Python中網(wǎng)絡(luò)請(qǐng)求的12種方式的詳細(xì)內(nèi)容,更多關(guān)于Python網(wǎng)絡(luò)請(qǐng)求的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
關(guān)于NumPy中asarray的用法及說(shuō)明
這篇文章主要介紹了關(guān)于NumPy中asarray的用法及說(shuō)明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-07-07
Python入門(mén)教程(三十三)Python的字符串格式化
這篇文章主要介紹了Python入門(mén)教程(三十三)Python的字符串格式化,為了確保字符串按預(yù)期顯示,我們可以使用 format()方法對(duì)結(jié)果進(jìn)行格式化,需要的朋友可以參考下2023-05-05
Python實(shí)現(xiàn)K折交叉驗(yàn)證法的方法步驟
這篇文章主要介紹了Python實(shí)現(xiàn)K折交叉驗(yàn)證法的方法步驟,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-07-07
Python的Tornado框架實(shí)現(xiàn)圖片上傳及圖片大小修改功能
Tornado是一個(gè)異步的Python Web開(kāi)發(fā)框架,同時(shí)也是一個(gè)優(yōu)秀的異步服務(wù)器開(kāi)發(fā)庫(kù),這里我們將來(lái)講解一下Python的Tornado框架實(shí)現(xiàn)圖片上傳及圖片大小修改功能方面的一些重點(diǎn):2016-06-06
Python將list保存到文件的3種方法實(shí)例代碼
這篇文章主要給大家介紹了關(guān)于Python將list保存到文件的3種方法,Python中提供了文件操作的功能,可以通過(guò)打開(kāi)和讀寫(xiě)文件實(shí)現(xiàn),文中通過(guò)代碼介紹的非常詳細(xì),需要的朋友可以參考下2024-02-02
手把手帶你了解python多進(jìn)程,多線(xiàn)程
這篇文章主要介紹了python多線(xiàn)程與多進(jìn)程及其區(qū)別詳解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2021-08-08
tensorflow 利用expand_dims和squeeze擴(kuò)展和壓縮tensor維度方式
今天小編就為大家分享一篇tensorflow 利用expand_dims和squeeze擴(kuò)展和壓縮tensor維度方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-02-02
使用pyqt 實(shí)現(xiàn)重復(fù)打開(kāi)多個(gè)相同界面
今天小編就為大家分享一篇使用pyqt 實(shí)現(xiàn)重復(fù)打開(kāi)多個(gè)相同界面,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-12-12

