Python3使用requests包抓取并保存網(wǎng)頁(yè)源碼的方法
本文實(shí)例講述了Python3使用requests包抓取并保存網(wǎng)頁(yè)源碼的方法。分享給大家供大家參考,具體如下:
使用Python 3的requests模塊抓取網(wǎng)頁(yè)源碼并保存到文件示例:
import requests html = requests.get("http://www.baidu.com") with open('test.txt','w',encoding='utf-8') as f: f.write(html.text)
這是一個(gè)基本的文件保存操作,但這里有幾個(gè)值得注意的問(wèn)題:
1.安裝requests包,命令行輸入pip install requests即可自動(dòng)安裝。很多人推薦使用requests,自帶的urllib.request也可以抓取網(wǎng)頁(yè)源碼
2.open方法encoding參數(shù)設(shè)為utf-8,否則保存的文件會(huì)出現(xiàn)亂碼。
3.如果直接在cmd中輸出抓取的內(nèi)容,會(huì)提示各種編碼錯(cuò)誤,所以保存到文件查看。
4.with open方法是更好的寫(xiě)法,可以自動(dòng)操作完畢后釋放資源。
另一個(gè)例子:
import requests ff = open('testt.txt','w',encoding='utf-8') with open('test.txt',encoding="utf-8") as f: for line in f: ff.write(line) ff.close()
這是演示讀取一個(gè)txt文件,每次讀取一行,并保存到另一個(gè)txt文件中的示例。
因?yàn)樵诿钚兄写蛴∶看巫x取一行的數(shù)據(jù),中文會(huì)出現(xiàn)編碼錯(cuò)誤,所以每次讀取一行并保存到另一個(gè)文件,這樣來(lái)測(cè)試讀取是否正常。(注意open的時(shí)候制定encoding編碼方式)
轉(zhuǎn)自:小談博客 http://www.tantengvip.com/2015/05/requests-html/
希望本文所述對(duì)大家Python程序設(shè)計(jì)有所幫助。
- python中requests模塊的使用方法
- python中requests庫(kù)session對(duì)象的妙用詳解
- python采用requests庫(kù)模擬登錄和抓取數(shù)據(jù)的簡(jiǎn)單示例
- Python使用requests發(fā)送POST請(qǐng)求實(shí)例代碼
- python中requests使用代理proxies方法介紹
- python?如何使用requests下載文件
- Python爬蟲(chóng)庫(kù)requests獲取響應(yīng)內(nèi)容、響應(yīng)狀態(tài)碼、響應(yīng)頭
- 詳解Python requests 超時(shí)和重試的方法
- Python requests timeout的設(shè)置
- 解決Python requests 報(bào)錯(cuò)方法集錦
- Python中Requests庫(kù)的實(shí)現(xiàn)示例
相關(guān)文章
Python getattr()函數(shù)使用方法代碼實(shí)例
這篇文章主要介紹了Python getattr()函數(shù)使用方法代碼實(shí)例,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-08-08Python出現(xiàn)segfault錯(cuò)誤解決方法
這篇文章主要介紹了Python出現(xiàn)segfault錯(cuò)誤解決方法,分析了系統(tǒng)日志提示segfault錯(cuò)誤的原因與對(duì)應(yīng)的解決方法,需要的朋友可以參考下2016-04-04Python寫(xiě)了個(gè)疫情信息快速查看工具實(shí)例代碼
本次使用PyQt5開(kāi)發(fā)了一款疫情信息快速查看工具,實(shí)現(xiàn)了多個(gè)數(shù)據(jù)源的查看,代碼量不大,功能相當(dāng)于瀏覽器,只是限定了一些特定網(wǎng)址,這篇文章主要介紹了Python寫(xiě)了個(gè)疫情信息快速查看工具,需要的朋友可以參考下2022-11-11Python雙向循環(huán)鏈表實(shí)現(xiàn)方法分析
這篇文章主要介紹了Python雙向循環(huán)鏈表,結(jié)合實(shí)例形式分析了Python雙向鏈表的定義、遍歷、添加、刪除、搜索等相關(guān)操作技巧,需要的朋友可以參考下2018-07-07selenium+超級(jí)鷹實(shí)現(xiàn)模擬登錄12306
這篇文章主要介紹了selenium+超級(jí)鷹實(shí)現(xiàn)模擬登錄12306,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-01-01Python常用庫(kù)大全及簡(jiǎn)要說(shuō)明
本文為大家羅列了Python開(kāi)發(fā)的常用庫(kù)和各個(gè)庫(kù)的簡(jiǎn)要說(shuō)明以及Python開(kāi)發(fā)工具,包管理,環(huán)境管理等其它常用資源和Python學(xué)習(xí)資料2020-01-01Python+wxPython實(shí)現(xiàn)個(gè)人鏈接收藏夾
這篇文章主要介紹了如何使用wxPython和XML數(shù)據(jù)源創(chuàng)建一個(gè)具有按鈕和Web視圖的應(yīng)用程序窗口,以便輕松管理和訪(fǎng)問(wèn)各種網(wǎng)頁(yè)鏈接,感興趣的可以了解下2023-08-08Python中將字典轉(zhuǎn)換為XML以及相關(guān)的命名空間解析
這篇文章主要介紹了Python中將字典轉(zhuǎn)換為XML以及相關(guān)的命名空間解析,包括使用字典創(chuàng)建XML等知識(shí),需要的朋友可以參考下2015-10-10python實(shí)現(xiàn)定時(shí)任務(wù)的多種方式詳解
Python社區(qū)提供了多種庫(kù)來(lái)實(shí)現(xiàn)定時(shí)任務(wù),下面這篇文章主要給大家介紹了關(guān)于python實(shí)現(xiàn)定時(shí)任務(wù)的多種方式,文中通過(guò)示例代碼介紹的非常詳細(xì),需要的朋友可以參考下2025-05-05