Python正則抓取新聞標(biāo)題和鏈接的方法示例
本文實(shí)例講述了Python正則抓取新聞標(biāo)題和鏈接的方法。分享給大家供大家參考,具體如下:
#-*-coding:utf-8-*-
import re
from urllib import urlretrieve
from urllib import urlopen
#獲取網(wǎng)頁(yè)信息
doc = urlopen("http://www.i#cn/news/").read() #自己找的一個(gè)大數(shù)據(jù)的新聞網(wǎng)站
#抓取新聞標(biāo)題和鏈接
def extract_title(info):
pat = '<h3><a target=\"_blank\"(.*?)</a></h3>'
title = re.findall(pat, info)
titles='\n'.join(title)
#print titles
#修改指定字符串
titles1=titles.replace('class="title"','title')
titles2=titles1.replace('>',':')
titles3=titles2.replace('href','url:')
titles4=titles3.replace('="/','"http://www.i#cn/')
#寫(xiě)入文件
save=open('xinwen.txt','w')
save.write(titles4)
save.close()
titles = extract_title(doc)
PS:這里再為大家提供2款非常方便的正則表達(dá)式工具供大家參考使用:
JavaScript正則表達(dá)式在線測(cè)試工具:
http://tools.jb51.net/regex/javascript
正則表達(dá)式在線生成工具:
http://tools.jb51.net/regex/create_reg
更多關(guān)于Python相關(guān)內(nèi)容可查看本站專題:《Python正則表達(dá)式用法總結(jié)》、《Python數(shù)據(jù)結(jié)構(gòu)與算法教程》、《Python Socket編程技巧總結(jié)》、《Python函數(shù)使用技巧總結(jié)》、《Python字符串操作技巧匯總》、《Python入門與進(jìn)階經(jīng)典教程》及《Python文件與目錄操作技巧匯總》
希望本文所述對(duì)大家Python程序設(shè)計(jì)有所幫助。
- python3爬蟲(chóng)之入門基礎(chǔ)和正則表達(dá)式
- 零基礎(chǔ)寫(xiě)python爬蟲(chóng)之神器正則表達(dá)式
- Python的爬蟲(chóng)包Beautiful Soup中用正則表達(dá)式來(lái)搜索
- Python爬蟲(chóng)正則表達(dá)式常用符號(hào)和方法
- python爬蟲(chóng) 正則表達(dá)式使用技巧及爬取個(gè)人博客的實(shí)例講解
- python正則表達(dá)式爬取貓眼電影top100
- Python使用正則表達(dá)式抓取網(wǎng)頁(yè)圖片的方法示例
- python正則匹配抓取豆瓣電影鏈接和評(píng)論代碼分享
- Python爬蟲(chóng)實(shí)現(xiàn)網(wǎng)頁(yè)信息抓取功能示例【URL與正則模塊】
- python正則表達(dá)式抓取成語(yǔ)網(wǎng)站
- Python正則抓取網(wǎng)易新聞的方法示例
- Python3使用正則表達(dá)式爬取內(nèi)涵段子示例
相關(guān)文章
使用Python進(jìn)行SSH和文件傳輸實(shí)現(xiàn)方法實(shí)例
這篇文章主要為大家介紹了使用Python進(jìn)行SSH和文件傳輸實(shí)現(xiàn)方法實(shí)例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-12-12
Python字典數(shù)據(jù)對(duì)象拆分的簡(jiǎn)單實(shí)現(xiàn)方法
這篇文章主要介紹了Python字典數(shù)據(jù)對(duì)象拆分的簡(jiǎn)單實(shí)現(xiàn)方法,涉及Python針對(duì)字典數(shù)據(jù)的相關(guān)遍歷、拆分等操作技巧,需要的朋友可以參考下2017-12-12
在Linux命令行中運(yùn)行Python腳本的流程步驟
Python是一種高級(jí)編程語(yǔ)言,被廣泛應(yīng)用于數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)、Web 開(kāi)發(fā)等領(lǐng)域,在Linux操作系統(tǒng)中,Python是一個(gè)默認(rèn)安裝的解釋器,用戶可以通過(guò)命令行界面(CLI)來(lái)運(yùn)行Python腳本,在本文中,我們將詳細(xì)介紹如何在Linux命令行中運(yùn)行Python腳本,需要的朋友可以參考下2023-11-11
python-opencv 將連續(xù)圖片寫(xiě)成視頻格式的方法
今天小編就為大家分享一篇python-opencv 將連續(xù)圖片寫(xiě)成視頻格式的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-01-01
python基于pygame實(shí)現(xiàn)飛機(jī)大作戰(zhàn)小游戲
這篇文章主要為大家詳細(xì)介紹了python基于pygame實(shí)現(xiàn)飛機(jī)大作戰(zhàn)小游戲,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2020-11-11
Python利用pyHook實(shí)現(xiàn)監(jiān)聽(tīng)用戶鼠標(biāo)與鍵盤(pán)事件
這篇文章主要介紹了Python利用pyHook實(shí)現(xiàn)監(jiān)聽(tīng)用戶鼠標(biāo)與鍵盤(pán)事件,很有實(shí)用價(jià)值的一個(gè)技巧,需要的朋友可以參考下2014-08-08
python計(jì)算書(shū)頁(yè)碼的統(tǒng)計(jì)數(shù)字問(wèn)題實(shí)例
這篇文章主要介紹了python計(jì)算書(shū)頁(yè)碼的統(tǒng)計(jì)數(shù)字問(wèn)題實(shí)例,對(duì)比2個(gè)實(shí)例講述了數(shù)字統(tǒng)計(jì)的技巧,非常實(shí)用,需要的朋友可以參考下2014-09-09
python使用正則表達(dá)式匹配txt特定字符串(有換行)
這篇文章主要給大家介紹了關(guān)于python使用正則表達(dá)式匹配txt特定字符串的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-12-12

