dede3.1分頁文字采集過濾規(guī)則詳說(圖文教程)續(xù)二
更新時(shí)間:2007年04月03日 00:00:00 作者:
稍微了解dede采集規(guī)則的朋友上篇內(nèi)容完全可以略過,下面看看如何以靜制動、以不變就萬變地解決分頁采集問題。
二、采集新目標(biāo)
目標(biāo)地址:
1、http://www.tiansou.net/Html/Y_CYFW/R_Gzzj/F_Gzjh/index.html
2、http://www.tiansou.net/Html/Y_CYFW/R_Gzzj/F_Gzjh/2007-2/9/20070209110903558.html
之所以選取兩個目標(biāo)頁面,是因?yàn)橐陨系膬蓚€頁面一個有分頁,而另一個沒有,并且在分頁和全文取樣部分有較大的差別。以下的說明是在為采集目標(biāo)地址(首頁)全部鏈接的基礎(chǔ)上改動的,個別地方會顯得蛇足,只為說明的方便。
目標(biāo)文字部分頭部代碼1:
目標(biāo)文字部分頭部代碼2:
通過比較不難發(fā)現(xiàn),兩個文字部分的開始采集部分能確定下來為描黑部分,開頭部分好說,代碼如下:
<TR>
<TD height="8"></TD>
</TR>
<TR>
<TD valign="top" class=Connet><p>
目標(biāo)文尾及分頁區(qū)域代碼1:
目標(biāo)文尾及分頁區(qū)域代碼2:

比較一下兩個結(jié)尾,盡管想把第一個的結(jié)尾再往前提一點(diǎn),但沒法子,要考慮到全部鏈接的共同部分,就只好取描黑的部分了,這也給今后確定過濾規(guī)則添了點(diǎn)麻煩,這是后話。先把結(jié)尾部分確定了吧:
</p>
</TD>
</TR>
二、采集新目標(biāo)
目標(biāo)地址:
1、http://www.tiansou.net/Html/Y_CYFW/R_Gzzj/F_Gzjh/index.html
2、http://www.tiansou.net/Html/Y_CYFW/R_Gzzj/F_Gzjh/2007-2/9/20070209110903558.html
之所以選取兩個目標(biāo)頁面,是因?yàn)橐陨系膬蓚€頁面一個有分頁,而另一個沒有,并且在分頁和全文取樣部分有較大的差別。以下的說明是在為采集目標(biāo)地址(首頁)全部鏈接的基礎(chǔ)上改動的,個別地方會顯得蛇足,只為說明的方便。
目標(biāo)文字部分頭部代碼1:

目標(biāo)文字部分頭部代碼2:

通過比較不難發(fā)現(xiàn),兩個文字部分的開始采集部分能確定下來為描黑部分,開頭部分好說,代碼如下:
復(fù)制代碼 代碼如下:
<TR>
<TD height="8"></TD>
</TR>
<TR>
<TD valign="top" class=Connet><p>
目標(biāo)文尾及分頁區(qū)域代碼1:

目標(biāo)文尾及分頁區(qū)域代碼2:

比較一下兩個結(jié)尾,盡管想把第一個的結(jié)尾再往前提一點(diǎn),但沒法子,要考慮到全部鏈接的共同部分,就只好取描黑的部分了,這也給今后確定過濾規(guī)則添了點(diǎn)麻煩,這是后話。先把結(jié)尾部分確定了吧:
復(fù)制代碼 代碼如下:
</p>
</TD>
</TR>
相關(guān)文章
php使用redis的有序集合zset實(shí)現(xiàn)延遲隊(duì)列應(yīng)用示例
這篇文章主要介紹了php使用redis的有序集合zset實(shí)現(xiàn)延遲隊(duì)列,結(jié)合具體實(shí)例形式分析了PHP基于redis的有序集合zset實(shí)現(xiàn)延遲隊(duì)列的具體原理、應(yīng)用場景及相關(guān)操作技巧,需要的朋友可以參考下2020-02-02晉城吧對DiscuzX進(jìn)行的前端優(yōu)化要點(diǎn)
晉城吧的服務(wù)器在美國,延遲相對國內(nèi)略微要高一些,所以優(yōu)化就顯得非常重要。2010-09-09PHP實(shí)現(xiàn)的pdo連接數(shù)據(jù)庫并插入數(shù)據(jù)功能簡單示例
這篇文章主要介紹了PHP實(shí)現(xiàn)的pdo連接數(shù)據(jù)庫并插入數(shù)據(jù)功能,結(jié)合簡單示例形式分析了pdo數(shù)據(jù)庫連接及執(zhí)行基本的插入SQL語句相關(guān)操作技巧,需要的朋友可以參考下2019-03-03PHP判斷IP并轉(zhuǎn)跳到相應(yīng)城市分站的方法
這篇文章主要介紹了PHP判斷IP并轉(zhuǎn)跳到相應(yīng)城市分站的方法,實(shí)例分析了php解析URL及跳轉(zhuǎn)的技巧,具有一定參考借鑒價(jià)值,需要的朋友可以參考下2015-03-03