亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python urllib2運(yùn)行過(guò)程原理解析

 更新時(shí)間:2020年06月04日 14:38:58   投稿:yaominghui  
這篇文章主要介紹了Python urllib2運(yùn)行過(guò)程原理解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下

1.urlopen函數(shù)

urllib2.urlopen(url[, data[, timeout[, cafile[, capath[, cadefault[, context]]]]])

注:

url表示目標(biāo)網(wǎng)頁(yè)地址,可以是字符串,也可以是請(qǐng)求對(duì)象Request

req= urllib2.Request(url, data,headers) response = urllib2.urlopen(req,timeout=3)

data表示post方式提交給目標(biāo)服務(wù)器的參數(shù)

data = urllib.urlencode(data)

import urllib,urllib2 
action_url="http://www.xxxxxx.com/post"#用于測(cè)試post的網(wǎng)址,返回提交的數(shù)據(jù) 
values={'name':"alice",'age':20} 
data=urllib.urlencode(values)#對(duì)表單數(shù)據(jù)編碼 
rqst=urllib2.Request(action_url,data) 
response=urllib2.urlopen(rqst)#模擬提交表單數(shù)據(jù)到url并獲得響應(yīng)

timeout表示超時(shí)時(shí)間設(shè)置。

返回值

  • response.read()返回頁(yè)面內(nèi)容
  • response.info()返回網(wǎng)頁(yè)信息
  • response.geturl()返回連接地址

這個(gè)函數(shù)可以像urllib.urlopen()那樣以u(píng)rl做參數(shù)。也能以Request實(shí)例為參數(shù),即用一個(gè)Request對(duì)象(下文構(gòu)造方法)來(lái)映射你提出的HTTP請(qǐng)求,在它最簡(jiǎn)單的使用形式中你將用你要請(qǐng)求的地址創(chuàng)建一個(gè)Request對(duì)象,這個(gè)Request對(duì)象中可以設(shè)置傳輸數(shù)據(jù)、headers等。通過(guò)調(diào)用urlopen并傳入Request對(duì)象,將返回一個(gè)file-like對(duì)象。urllib2還提供了接口來(lái)處理一般情況,例如:基礎(chǔ)驗(yàn)證,cookies,代理和其他,它們通過(guò)handlers和openers的對(duì)象實(shí)現(xiàn)。

2、Request函數(shù)

urllib2.Request(url[, data][, headers][, origin_req_host][, unverifiable])

用于構(gòu)造Request對(duì)象,可以傳遞data數(shù)據(jù),添加請(qǐng)求頭(headers)等,構(gòu)造好后作為urllib2.urlopen()的參數(shù)。

注:

url表示目標(biāo)網(wǎng)頁(yè)地址,可以是字符串,也可以是請(qǐng)求對(duì)象Request

data表示post方式提交給目標(biāo)服務(wù)器的參數(shù)

headers表示用戶(hù)標(biāo)識(shí),是一個(gè)字典類(lèi)型的數(shù)據(jù),有些不允許腳本的抓取,所以需要用戶(hù)代理,像火狐瀏覽器的代理就是類(lèi)似:

Mozilla/5.0 (X11; U; Linux i686)Gecko/20071127 Firefox/2.0.0.11

瀏覽器的標(biāo)準(zhǔn)UA格式為:瀏覽器標(biāo)識(shí) (操作系統(tǒng)標(biāo)識(shí); 加密等級(jí)標(biāo)識(shí); 瀏覽器語(yǔ)言) 渲染引擎標(biāo)識(shí) 版本信息 ,headers默認(rèn)是

Python-urllib/2.6

origin_req_host表示請(qǐng)求方的主機(jī)域名或者ip地址。

headers = {'User-Agent':'Mozilla/5.0 (X11; U; Linux i686)Gecko/20071127 Firefox/2.0.0.11'}

import urllib  
import urllib2  
url = 'http://www.weibo.cn/'  
user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'  
h = { 'User-Agent' : user_agent }  
req = urllib2.Request(url,headers=h)  
response = urllib2.urlopen(req)  
print response.read()

3、build_opener()

build_opener([handler1 [ handler2, ... ]])

urllib2.urlopen()函數(shù)不支持驗(yàn)證、cookie或者其它HTTP高級(jí)功能。要支持這些功能,必須使用build_opener()函數(shù)創(chuàng)建自定義Opener對(duì)象。

參數(shù)handler是Handler實(shí)例,常用的有HTTPBasicAuthHandler、HTTPCookieProcessor、ProxyHandler等。
build_opener ()返回的對(duì)象具有open()方法,與urlopen()函數(shù)的功能相同。

如果要修改http報(bào)頭,可以用:

import urllib2 
opener = urllib2.build_opener() 
opener.addheaders = [('User-agent', 'Mozilla/5.0')] 
opener.open('http://www.example.com/')

以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。

相關(guān)文章

  • Python數(shù)據(jù)抓取爬蟲(chóng)代理防封IP方法

    Python數(shù)據(jù)抓取爬蟲(chóng)代理防封IP方法

    在本篇內(nèi)容里小編給大家分享了關(guān)于Python數(shù)據(jù)抓取爬蟲(chóng)代理防封IP方法講解,需要的朋友們可以跟著學(xué)習(xí)下。
    2018-12-12
  • Python對(duì)excel的基本操作方法

    Python對(duì)excel的基本操作方法

    這篇文章主要介紹了Python對(duì)excel的基本操作,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2021-02-02
  • Python編程super應(yīng)用場(chǎng)景及示例解析

    Python編程super應(yīng)用場(chǎng)景及示例解析

    最近有粉絲向我咨詢(xún)super相關(guān)的問(wèn)題,說(shuō)網(wǎng)上搜索到的教程不夠通俗易懂,看了之后還是不太理解。所以在這里基于我自己的理解來(lái)講解一下super
    2021-10-10
  • 自動(dòng)化測(cè)試時(shí)基于Python常用的幾個(gè)加密算法總結(jié)

    自動(dòng)化測(cè)試時(shí)基于Python常用的幾個(gè)加密算法總結(jié)

    這幾天做自動(dòng)化測(cè)試,遇到一個(gè)問(wèn)題,那就是接口的請(qǐng)求的密碼是加密的,產(chǎn)品的要求是不能使用使用其他特殊手段,他給提供加密算法,需要在接口請(qǐng)求的時(shí)候,使用加密算法處理后的數(shù)據(jù)傳參,本文主要是整理了幾個(gè)加密算法,以便后續(xù)測(cè)試使用,需要的朋友可以參考下
    2023-12-12
  • python環(huán)境的報(bào)錯(cuò)解決方法

    python環(huán)境的報(bào)錯(cuò)解決方法

    這篇文章主要為大家介紹了python環(huán)境的報(bào)錯(cuò)解決方法,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2023-08-08
  • 使用python實(shí)現(xiàn)離散時(shí)間傅里葉變換的方法

    使用python實(shí)現(xiàn)離散時(shí)間傅里葉變換的方法

    這篇文章主要介紹了使用python實(shí)現(xiàn)離散時(shí)間傅里葉變換的方法,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2019-09-09
  • Python?虛擬環(huán)境的價(jià)值和常用命令詳解

    Python?虛擬環(huán)境的價(jià)值和常用命令詳解

    在實(shí)際項(xiàng)目開(kāi)發(fā)中,我們通常會(huì)根據(jù)自己的需求去下載各種相應(yīng)的框架庫(kù),如Scrapy、Beautiful?Soup等,但是可能每個(gè)項(xiàng)目使用的框架庫(kù)并不一樣,或使用框架的版本不一樣,今天給大家分享下Python?虛擬環(huán)境的價(jià)值和常用命令,感興趣的朋友一起看看吧
    2022-05-05
  • CentOS 7 安裝python3.7.1的方法及注意事項(xiàng)

    CentOS 7 安裝python3.7.1的方法及注意事項(xiàng)

    這篇文章主要介紹了CentOS 7 安裝python3.7.1的方法,文中給大家提到了注意事項(xiàng),需要的朋友可以參考下
    2018-11-11
  • 對(duì)Python3.6 IDLE常用快捷鍵介紹

    對(duì)Python3.6 IDLE常用快捷鍵介紹

    今天小編就為大家分享一篇對(duì)Python3.6 IDLE常用快捷鍵介紹,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2018-07-07
  • python測(cè)試驅(qū)動(dòng)開(kāi)發(fā)實(shí)例

    python測(cè)試驅(qū)動(dòng)開(kāi)發(fā)實(shí)例

    這篇文章主要介紹了python測(cè)試驅(qū)動(dòng)開(kāi)發(fā)實(shí)例,非常具有實(shí)用價(jià)值,需要的朋友可以參考下
    2014-10-10

最新評(píng)論