python BeautifulSoup設(shè)置頁面編碼的方法
更新時(shí)間:2015年04月03日 08:55:42 投稿:junjie
這篇文章主要介紹了python BeautifulSoup設(shè)置頁頁編碼的方法,本文直接給出代碼救命,需要的朋友可以參考下
在用BeautifulSoup進(jìn)行抓取頁面的時(shí)候,會(huì)各種各樣的編碼錯(cuò)誤。
可以通過在beautifulsoup中指定字符編碼,解決問題。
復(fù)制代碼 代碼如下:
import urllib2
from BeautifulSoup import BeautifulSoup
page = urllib2.urlopen('http://www.163.com');
soup = BeautifulSoup(page,from_encoding="gb2312")
print soup.originalEncoding
print soup.prettify()
紅色部分表示需要注意的地方。在BeautifulSoup構(gòu)造器中傳入fromEncoding參數(shù)即可解決亂碼問題,當(dāng)然具體參數(shù)值是什么就要看你獲取頁面的編碼是什么
您可能感興趣的文章:
- Python使用email模塊對(duì)郵件進(jìn)行編碼和解碼的實(shí)例教程
- 詳解Python中使用base64模塊來處理base64編碼的方法
- Python中json格式數(shù)據(jù)的編碼與解碼方法詳解
- python判斷字符串編碼的簡單實(shí)現(xiàn)方法(使用chardet)
- Python字符編碼判斷方法分析
- python編碼總結(jié)(編碼類型、格式、轉(zhuǎn)碼)
- Python編碼類型轉(zhuǎn)換方法詳解
- 學(xué)習(xí)python處理python編碼問題
- Python開發(fā)編碼規(guī)范
- Python設(shè)置默認(rèn)編碼為utf8的方法
相關(guān)文章
對(duì)python中詞典的values值的修改或新增KEY詳解
今天小編就為大家分享一篇對(duì)python中詞典的values值的修改或新增KEY詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2019-01-01python with statement 進(jìn)行文件操作指南
在Python中,with關(guān)鍵字是一個(gè)替你管理實(shí)現(xiàn)上下文協(xié)議對(duì)象的好東西。例如:file等。在file的結(jié)束,會(huì)自動(dòng)關(guān)閉該文件句柄。而這正是本文所需要的2014-08-08Python接口自動(dòng)化淺析Token應(yīng)用原理
本文主要介紹token基本概念、運(yùn)行原理及在自動(dòng)化中接口如何攜帶token進(jìn)行訪問,附含源碼,內(nèi)容非常詳細(xì)易理解,有需要的朋友可以參考下2021-08-08用Python將動(dòng)態(tài)GIF圖片倒放播放的方法
GIF(Graphics Interchange Format) 是一種可以用來呈現(xiàn)動(dòng)畫效果的圖片格式,原理就是保存很多幀(Frame)靜態(tài)圖像,然后連續(xù)呈現(xiàn)。這篇文章主要介紹了用Python將動(dòng)態(tài)GIF圖片倒放播放的方法,需要的朋友可以參考下2016-11-11