python處理cookie詳解
要在用戶瀏覽器上安裝cookie,HTTP服務器向HTTP響應添加類似以下內容的HTTP報頭:
Set-Cookie:session=8345234;expires=Sun,15-Nov-2013 15:00:00 GMT;path=/;domain=baidu.com
expires是cookie的生存周期,path是cookie的有效路徑,domain是cookie的有效域.
路徑"path"用于設置可以讀取一個cookie的最頂層的目錄.
將cookie的路徑設置為你的網頁最頂層的目錄可以讓該該目錄下的所有網頁都能訪問該cookie.
方法:在你的cookie中加入path=/; 如果你只想讓"food" 目錄中的網頁可以使用該cookie,則你加入path=/food;.
domain:有些網站有許多小的域名,例如百度可能還在"news.baidu.com" "zhidao.baidu.com" 和"v.baidu.com" 域名下有網頁.
如果想讓"baidu.com"下的所有機器都可以讀取該cookie,必須在cookie中加入 "domain=.baidu.com" .
用戶瀏覽器會存儲Cookie直到過期,瀏覽器會向符合path和domain的服務器發(fā)送類似以下內容的HTTP請求報頭:
Cookie:session=8345234。
例如,登陸www.baidu.com的時候,百度服務器發(fā)送回的HTTP響應報頭中cookie是:
Set-Cookie:H_PS_PSSID=4681_4567_1452_9876_4759; path=/; domain=.baidu.com
Set-Cookie:BDSVRTM=74; path=/
瀏覽器的HTTP請求報頭:
Cookie:BAIDUID=0FD996SDFG12********107B9C227F4C:FG=1; locale=zh; bdshare_firstime=1384567418140; NBID=D830DD2345HH2818A9F4134E5A2D778D3B:FG=1; H_PS_LC=4_shadu2014; BD_CK_SAM=1; H_PS_PSSID=4681_4567_1452_9876_4759
瀏覽器將cookie發(fā)送回HTTP服務器時,使用key=value字符串的編碼形式,不返回expires,path和domain等可選屬性。
cookie字符串通常位于HTTP_COOKIE環(huán)境變量中,可以如下讀?。?/P>
import os
print "Content-type: text/plain\n"
if "HTTP_COOKIE" in os.environ:
print os.environ["HTTP_COOKIE"]
else:
print "HTTP_COOKIE not set!"
Python中Cookie模塊(python2,python3中為http.cookies)提供了一個類似字典的特殊對象SimpleCookie,其中存儲并管理著稱為Morsel的cookie值集合。
每個Morsel都有name,value以及可選屬性(expires,path,domain,comment,max-age,secure,version,httponly)。
SimpleCookie可使用output()方法創(chuàng)建以HTTP報頭形式表示的cookie數(shù)據輸出,用js_output()方法生成包含javascript代碼的字符串。
用HTTP_COOKIE生成cookie:
cookie=Cookie.SimpleCookie(os.environ['HTTP_COOKIE'])
print cookie.output()
set cookie:
import Cookie
import datetime
import random
expiration = datetime.datetime.now() + datetime.timedelta(days=30)
cookie = Cookie.SimpleCookie()
cookie["session"] = random.randint(1,1000000000)
cookie["session"]["domain"] = ".baidu.com"
cookie["session"]["path"] = "/"
cookie["session"]["expires"] = expiration.strftime("%a, %d-%b-%Y %H:%M:%S PST")
print "Content-type: text/plain"
print cookie.output()
print "Cookie set with: " + cookie.output()
輸出:
Content-type: text/plain
Set-Cookie: session=155209565; Domain=.jayconrod.com; expires=Mon, 03-Mar-2014 07:42:47 PST; Path=/
Cookie set with: Set-Cookie: session=155209565; Domain=.jayconrod.com; expires=Mon, 03-Mar-2014 07:42:47 PST; Path=/
Python中cookielib庫(python3中為http.cookiejar)為存儲和管理cookie提供客戶端支持。
該模塊主要功能是提供可存儲cookie的對象。使用此模塊捕獲cookie并在后續(xù)連接請求時重新發(fā)送,還可以用來
處理包含cookie數(shù)據的文件。
這個模塊主要提供了這幾個對象,CookieJar,F(xiàn)ileCookieJar,MozillaCookieJar,LWPCookieJar。
CookieJar對象存儲在內存中。
>>> import urllib2
>>> import cookielib
>>> cookie=cookielib.CookieJar()
>>> handler=urllib2.HTTPCookieProcessor(cookie)
>>> opener=urllib2.build_opener(handler)
>>> opener.open('http://www.google.com.hk')<addinfourl at 161806444 whose fp = <socket._fileobject object at 0x9a348ac>>
訪問google的cookie已經被捕捉了。
來看下是怎樣的:
>>> print cookie
<cookielib.CookieJar[<Cookie NID=67=B6YQoEIEjcqDj-adada_WmNYl_JvADsDEDchFTMtAgERTgRjK452ko6gr9G0Q5p9h1vlmHpCR56XCrWwg1pv6iqhZnaVlnwoeM-Ln7kIUWi92l-X2fvUqgwDnN3qowDW for .google.com.hk/>, <Cookie PREF=ID=7ae0fa51234ce2b1:FF=0:NW=1:TM=1391219446:LM=1391219446:S=cFiZ5X8ts9NY3cmk for .google.com.hk/>]>
看來是Cookie實例的集合,Cookie實例有name,value,path,expires等屬性:
>>> for ck in cookie:
... print ck.name,':',ck.value
...
NID : 67=B6YQoEIEjcqDj-adada_WmNYl_JvADsDEDchFTMtAgERTgRjK452ko6gr9G0Q5p9h1vlmHpCR56XCrWwg1pv6iqhZnaVlnwoeM-Ln7kIUWi92l-X2fvUqgwDnN3qowDW
PREF : ID=7ae0fa51234ce2b1:FF=0:NW=1:TM=1391219446:LM=1391219446:S=cFiZ5X8ts9NY3cmk
也可以將cookie捕捉到文件中。
FileCookieJar(filename)
創(chuàng)建FileCookieJar實例,檢索cookie信息并將信息存儲到文件中,filename是文件名。
MozillaCookieJar(filename)
創(chuàng)建與Mozilla cookies.txt文件兼容的FileCookieJar實例。
LWPCookieJar(filename)
創(chuàng)建與libwww-perl Set-Cookie3文件兼容的FileCookieJar實例。
代碼:
import urllib2
import cookielib
def HandleCookie():
#handle cookie whit file
filename='FileCookieJar.txt'
url='http://www.google.com.hk'
FileCookieJar=cookielib.LWPCookieJar(filename)
FileCookeJar.save()
opener =urllib2.build_opener(urllib2.HTTPCookieProcessor(FileCookieJar))
opener.open(url)
FileCookieJar.save()
print open(filename).read()
#read cookie from file
readfilename = "readFileCookieJar.txt"
MozillaCookieJarFile =cookielib.MozillaCookieJar(readfilename)
print MozillaCookieJarFile
MozillaCookieJarFile.load(cookieFilenameMozilla)
print MozillaCookieJarFile
if __name__=="__main__":
HandleCookie()
相關文章
Python實現(xiàn)讀取目錄所有文件的文件名并保存到txt文件代碼
這篇文章主要介紹了Python實現(xiàn)讀取目錄所有文件的文件名并保存到txt文件代碼,本文分別使用os.listdir和os.walk實現(xiàn)給出兩段實現(xiàn)代碼,需要的朋友可以參考下2014-11-11