Python requests獲取網(wǎng)頁常用方法解析
這篇文章主要介紹了Python requests獲取網(wǎng)頁常用方法解析,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
主要記錄使用 requests 模塊獲取網(wǎng)頁源碼的方法
class Crawler(object): """ 采集類 """ def __init__(self, base_url): self._base_url = base_url self._cookie = None self._getCookie() def _getCookie(self): """ 獲取站點(diǎn)cookie :return: """ try: res = requests.get(self._base_url) res.raise_for_status() # TODO response.cookies獲取到的是一個(gè)cookiejar對象,需要使用requests.utils.dict_from_cookiejar來 # TODO 將cookiejar對象轉(zhuǎn)換為一個(gè)字典,這個(gè)字典后續(xù)使用的時(shí)候,在請求時(shí)直接傳入就可以了, # 如 requests.get(url, cookies=cookies) self._cookie = requests.utils.dict_from_cookiejar(res.cookies) print self._cookie except Exception as e: print e def get_html_text(self, url, **kwargs): """ 爬取網(wǎng)頁的通用代碼框架 :param url: :param method: :param kwargs: :return: """ try: kwargs.setdefault('cookies', self._cookie) res = requests.get(url, **kwargs) # TODO 若響應(yīng)狀態(tài)碼不是200, 拋出 HTTPError 異常 res.raise_for_status() res.encoding = res.apparent_encoding # print requests.utils.dict_from_cookiejar(res.cookies) return res.text except Exception as e: print traceback.print_exc() return
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
簡單實(shí)例帶你了解Python的編譯和執(zhí)行全過程
python 是一種解釋型的編程語言,所以不像編譯型語言那樣需要顯式的編譯過程。然而,在 Python 代碼執(zhí)行之前,它需要被解釋器轉(zhuǎn)換成字節(jié)碼,這個(gè)過程就是 Python 的編譯過程,還不知道的朋友快來看看吧2023-04-04詳解pyqt5的UI中嵌入matplotlib圖形并實(shí)時(shí)刷新(挖坑和填坑)
這篇文章主要介紹了詳解pyqt5的UI中嵌入matplotlib圖形并實(shí)時(shí)刷新(挖坑和填坑),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-08-08NVIDIA安裝CUDA的實(shí)現(xiàn)(圖文教程)
本文主要介紹了NVIDIA安裝CUDA的實(shí)現(xiàn),包括系統(tǒng)要求、軟件下載、安裝步驟以及常見問題解決,具有一定的參考價(jià)值,感興趣的可以了解一下2024-01-01Python opencv缺陷檢測的實(shí)現(xiàn)及問題解決
這篇文章主要介紹了Python opencv缺陷檢測的實(shí)現(xiàn)及問題解決,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-04-04Pycharm虛擬環(huán)境創(chuàng)建并使用命令行指定庫的版本進(jìn)行安裝
Pycharm創(chuàng)建的項(xiàng)目,使用了虛擬環(huán)境,對庫的版本進(jìn)行管理,有些項(xiàng)目的對第三方庫的版本要求不同,可使用虛擬環(huán)境進(jìn)行管理,直接想通過pip命令安裝可以參考下本文的操作步驟2022-07-07Python PaddlePaddle機(jī)器學(xué)習(xí)之求解線性模型
這篇文章主要介紹了Python PaddlePaddle機(jī)器學(xué)習(xí)之求解線性模型,文章圍繞主題展開詳細(xì)的內(nèi)容介紹,具有一定參考價(jià)值,需要的小伙伴可以參考一下2022-08-08Python編程快速上手——Excel到CSV的轉(zhuǎn)換程序案例分析
這篇文章主要介紹了Python Excel到CSV的轉(zhuǎn)換程序,結(jié)合具體案例形式分析了Python操作Excel到CSV轉(zhuǎn)換的操作技巧與相關(guān)注意事項(xiàng),需要的朋友可以參考下2020-02-02Pandas出現(xiàn)KeyError的問題解決及分析
本文主要介紹了Pandas出現(xiàn)KeyError的問題解決及分析,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-01-01