python抓取網(wǎng)頁內(nèi)容示例分享
更新時間:2014年02月24日 15:09:50 作者:
這篇文章主要介紹了python抓取網(wǎng)頁內(nèi)容示例,在抓取的時候?qū)τ趃bk編碼網(wǎng)頁還需要轉(zhuǎn)化一下,具體看下面的示例吧
復(fù)制代碼 代碼如下:
import socket
def open_tcp_socket(remotehost,servicename):
s=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
portnumber=socket.getservbyname(servicename,'tcp')
s.connect((remotehost,portnumber))
return s
mysocket=open_tcp_socket('www.taobao.com','http')
mysocket.send('hello')
while(1):
data=mysocket.recv(1024)
if(data):
print data.decode('gbk').encode('utf-8')#對于gbk編碼網(wǎng)頁必須這樣轉(zhuǎn)化一下
else:
break
mysocket.close()
您可能感興趣的文章:
- Python 抓取動態(tài)網(wǎng)頁內(nèi)容方案詳解
- 零基礎(chǔ)寫python爬蟲之使用urllib2組件抓取網(wǎng)頁內(nèi)容
- Python實現(xiàn)周期性抓取網(wǎng)頁內(nèi)容的方法
- python抓取網(wǎng)頁中圖片并保存到本地
- Python3使用requests包抓取并保存網(wǎng)頁源碼的方法
- python抓取網(wǎng)頁圖片并放到指定文件夾
- 用Python程序抓取網(wǎng)頁的HTML信息的一個小實例
- Python實現(xiàn)抓取網(wǎng)頁并且解析的實例
- Python爬蟲實現(xiàn)網(wǎng)頁信息抓取功能示例【URL與正則模塊】
- Python簡單實現(xiàn)網(wǎng)頁內(nèi)容抓取功能示例
相關(guān)文章
Python計算開方、立方、圓周率,精確到小數(shù)點后任意位的方法
今天小編就為大家分享一篇Python計算開方、立方、圓周率,精確到小數(shù)點后任意位的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-07-07Python Django切換MySQL數(shù)據(jù)庫實例詳解
這篇文章主要介紹了Python Django切換MySQL數(shù)據(jù)庫實例詳解,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習或者工作具有一定的參考學(xué)習價值,需要的朋友可以參考下2019-07-07python實現(xiàn)決策樹C4.5算法詳解(在ID3基礎(chǔ)上改進)
下面小編就為大家?guī)硪黄猵ython實現(xiàn)決策樹C4.5算法詳解(在ID3基礎(chǔ)上改進)。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2017-05-05Python利用柯里化實現(xiàn)提高代碼質(zhì)量
柯里化(Currying)是函數(shù)式編程中的一個重要概念,它可以將一個多參數(shù)函數(shù)轉(zhuǎn)化為一系列單參數(shù)函數(shù)的組合,本文將詳細解釋什么是柯里化,如何在Python中實現(xiàn)柯里化,感興趣的可以了解下2024-01-01