正則表達(dá)式對(duì)于Python來說并不是獨(dú)有的，最近在鼓搗一個(gè)東西把google搜索的結(jié)果中所有的站點(diǎn)地址導(dǎo)出，于是想到用python正則表達(dá)式提取搜索結(jié)果中的站點(diǎn)地址，小編把具體實(shí)現(xiàn)思路整理分享給大家

正則表達(dá)式對(duì)于Python來說并不是獨(dú)有的，最近在把google搜索的結(jié)果中所有的站點(diǎn)地址導(dǎo)出，于是想到用python正則表達(dá)式提取搜索結(jié)果中的站點(diǎn)地址。

這其中涉及幾個(gè)需要解決的問題：

1、獲取搜索的結(jié)果文本

為了獲得更多的地址，我使用了Google的高級(jí)搜索功能，每個(gè)頁面顯示100條結(jié)果。

獲得顯示的結(jié)果后，可以查看源碼，并保持成文本文件就有了搜索的結(jié)果文本

2、分析如何提取站點(diǎn)信息

首先需要分析獲取的頁面，查看以怎樣的方式可以提取出站點(diǎn)信息。

我使用IE8自帶的開發(fā)工具（按F12就會(huì)彈出來）中的探查器功能查看自己要關(guān)心的內(nèi)容有什么特殊的格式

從上圖可以看出我需要的站點(diǎn)在標(biāo)簽<cite></cite>中，所以我使用正則表達(dá)式提取這其中的文本是否就可以呢？

3、編寫正則表達(dá)式來獲取站點(diǎn)地址

接下來的就是寫表達(dá)式了，我使用Python3.2編寫的，方便好用（~_~）

代碼如下，先把搜索結(jié)果頁面保持到e:/t3.txt中，在執(zhí)行如下代碼

import re
p = re.compile(r'<cite>([^<>\/].+?)</cite>')
f = open("e:/t3.txt", encoding='utf-8')
content = f.read()
print ("\n".join(p.findall(content)))

運(yùn)行如下：

大家可以對(duì)照一下運(yùn)行效果圖，看看所有的站點(diǎn)地址是不是都給獲取到了。

您可能感興趣的文章:

相關(guān)文章

mysql正則表達(dá)式 LIKE 通配符
由MySQL提供的模式匹配的其他類型是使用擴(kuò)展正則表達(dá)式。當(dāng)你對(duì)這類模式進(jìn)行匹配測(cè)試時(shí)，使用REGEXP和NOT REGEXP操作符(或RLIKE和NOT RLIKE，它們是同義詞)。
2009-10-10
中文用戶名的js檢驗(yàn)正則
好多網(wǎng)站需要用中文用戶名注冊(cè)，下面的代碼就是客戶端檢測(cè)。強(qiáng)烈建議后臺(tái)也要控制一下。
2009-11-11
javascript RegExp 對(duì)象屬性與方法和應(yīng)用
RegExp對(duì)象（至今為止我看到過的最通俗易懂和深入的正則表達(dá)式教程）。
2009-10-10
求個(gè)簡(jiǎn)單正則
求個(gè)簡(jiǎn)單正則...
2006-07-07
JavaScript正則表達(dá)式校驗(yàn)非零的正整數(shù)實(shí)例
本文分享了JavaScript正則表達(dá)式（^[1-9]\d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^\+?[1-9][0-9]*$）校驗(yàn)非零的正整數(shù)實(shí)例代碼，代碼簡(jiǎn)單易懂，需要的朋友可以看下
2016-12-12
正則表達(dá)式直接在EXCEL中使用的詳細(xì)步驟
這篇文章主要介紹了正則表達(dá)式直接在EXCEL中使用的詳細(xì)步驟,本文給大家介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值，需要的朋友可以參考下
2021-03-03
正則表達(dá)式的神奇世界之表達(dá)、匹配和提取全解析
這篇文章主要給大家介紹了關(guān)于正則表達(dá)式的神奇世界之表達(dá)、匹配和提取的相關(guān)資料,正則表達(dá)式是由一些特定的字符組成,代表一個(gè)規(guī)則,可以用來檢驗(yàn)數(shù)據(jù)格式是否合法,也可以在一段文本中查找滿足要求的內(nèi)容,需要的朋友可以參考下
2024-02-02
eregi_replace與preg_replace 函數(shù)代碼的用法比較
eregi_replace與preg_replace 函數(shù)代碼的用法比較...
2007-03-03
Java正則表達(dá)式學(xué)習(xí)教程
這篇文章主要是關(guān)于Java正則表達(dá)式的學(xué)習(xí)教程，本教程的目的在于幫助你駕馭Java正則表達(dá)式，感興趣的小伙伴們可以參考一下
2015-12-12
最新手機(jī)號(hào)碼、電話號(hào)碼正則表達(dá)式
相信大家對(duì)正則表達(dá)式一定都有所了解和研究，這篇文章主要為大家分享了最新驗(yàn)證手機(jī)號(hào)碼和電話號(hào)碼的正則表達(dá)式,具有一定的參考價(jià)值，感興趣的小伙伴們可以參考一下
2016-11-11