Python抓取百度查詢結果的方法
更新時間:2015年07月08日 10:34:38 作者:光索與諾
這篇文章主要介紹了Python抓取百度查詢結果的方法,涉及Python正則匹配及字符串與URL操作的相關技巧,需要的朋友可以參考下
本文實例講述了Python抓取百度查詢結果的方法。分享給大家供大家參考。具體實現(xiàn)方法如下:
#win python 2.7.x import re,sys,urllib,codecs xh = urllib.urlopen("http://www.baidu.com/s?q1=123&rn=100").read().decode('utf-8') rc = re.compile(r'<td class=f><h3 class="t"><a.*?>(?P<first>.*?)</h3>',re.I) match = rc.finditer(xh) rcr = re.compile(r'<[^>]+>',re.I) f = codecs.open("xiaohei.txt", "w", "utf-8") for i in rc.finditer(xh): ss = i.group(0) s1 = rcr.sub('',ss) print (s1) f.write(s1) f.close()
希望本文所述對大家的Python程序設計有所幫助。
相關文章
python文件轉(zhuǎn)為exe文件的方法及用法詳解
py2exe是一個將python腳本轉(zhuǎn)換成windows上的可獨立執(zhí)行的可執(zhí)行程序(*.exe)的工具,這樣,你就可以不用裝python而在windows系統(tǒng)上運行這個可執(zhí)行程序。本文重點給大家介紹python文件轉(zhuǎn)為exe文件的方法,感興趣的朋友跟隨小編一起看看吧2019-07-07