帝國(guó)cms采集圖文教程(上,中,下)全集
發(fā)布時(shí)間:2012-05-21 10:50:22 作者:佚名
我要評(píng)論

帝國(guó)cms采集圖文教程,現(xiàn)在把上,中,下全部都發(fā)來(lái).給大家方便的看.
帝國(guó)cms是我們用得比較多得PHP的建站系統(tǒng),在建站過(guò)程中,如果自己沒(méi)有信息源,只能靠手工不斷的重復(fù)copy和粘貼,這樣費(fèi)時(shí)費(fèi)力,于是我們就要使用帝國(guó)cms自帶的采集功能來(lái)完成信息的錄入。為了深入了解帝國(guó)cms采集功能,下面我們以“新浪各地新聞”欄目為例來(lái)進(jìn)行實(shí)戰(zhàn)采集。
一、增加采集節(jié)點(diǎn)
1、添加節(jié)點(diǎn):

2、選擇要增加采集的欄目:

3、進(jìn)入增加節(jié)點(diǎn)表單:

4、在節(jié)點(diǎn)名稱框里起個(gè)名字,然后把要采集的新浪各地新聞列表地址copy過(guò)來(lái):


5、下來(lái)發(fā)現(xiàn)好多選項(xiàng),如“采集頁(yè)面地址方式二,內(nèi)容頁(yè)地址前綴...”先不要理他,后面再一一詳解,直接拉到 “信息鏈接區(qū)域正則”這里:

6、這里是設(shè)置采集的列表信息鏈接區(qū)域正則,我們點(diǎn)擊查看新浪各地新聞列表“源文件”:

7、把源文件代碼copy到Dreamweaver里,在Dreamweaver里選定要采集的信息鏈接區(qū)域:

8、切換到Dreamweaver代碼方式,
一、增加采集節(jié)點(diǎn)
1、添加節(jié)點(diǎn):

2、選擇要增加采集的欄目:

3、進(jìn)入增加節(jié)點(diǎn)表單:

4、在節(jié)點(diǎn)名稱框里起個(gè)名字,然后把要采集的新浪各地新聞列表地址copy過(guò)來(lái):


5、下來(lái)發(fā)現(xiàn)好多選項(xiàng),如“采集頁(yè)面地址方式二,內(nèi)容頁(yè)地址前綴...”先不要理他,后面再一一詳解,直接拉到 “信息鏈接區(qū)域正則”這里:

6、這里是設(shè)置采集的列表信息鏈接區(qū)域正則,我們點(diǎn)擊查看新浪各地新聞列表“源文件”:

7、把源文件代碼copy到Dreamweaver里,在Dreamweaver里選定要采集的信息鏈接區(qū)域:

8、切換到Dreamweaver代碼方式,
- 就是信息鏈接區(qū)域:

9、得到信息鏈接區(qū)域正則:

10、得到信息頁(yè)鏈接正則:

11、注意:如果信息頁(yè)鏈接是相對(duì)地址,例如< a href="/c/2012-03-05/205924063527.shtml" target="_blank" >,那么“內(nèi)容頁(yè)地址前綴”要加域名:

12、現(xiàn)在要采集內(nèi)容頁(yè)的標(biāo)題和內(nèi)容:

13、查看新聞頁(yè)“源文件”,找title標(biāo)簽:

14、取得標(biāo)題正則:

15、這里是要采集的內(nèi)容區(qū)域:

16、取得新聞內(nèi)容正則:

(注意:新聞內(nèi)容正則里的 d_id='*' 用了通配符,因?yàn)槊恳黄侣劦膁_id值是不同的,所以可以用*來(lái)代替它,“*”可以代替任意字符。)
17、點(diǎn)擊提交按鈕就完成了整個(gè)采集節(jié)點(diǎn):

二、預(yù)覽采集節(jié)點(diǎn)是否正確
1、提交按鈕后返回管理節(jié)點(diǎn):

2、點(diǎn)擊“預(yù)覽”采集,進(jìn)入節(jié)點(diǎn)預(yù)覽結(jié)果:

3、采集內(nèi)容頁(yè)列表

4、采集內(nèi)容頁(yè)頁(yè)面:

三、采集
1、預(yù)覽采集節(jié)點(diǎn)無(wú)誤后,然后返回“管理節(jié)點(diǎn)”,點(diǎn)擊“開(kāi)始采集”鏈接就開(kāi)始進(jìn)行采集:

2、系統(tǒng)正在采集中:

3、采集完后顯示本地臨時(shí)入庫(kù)的信息,這時(shí)可以對(duì)臨時(shí)入庫(kù)的信息進(jìn)行修改或者刪除:

4、修改信息頁(yè)面如圖:

5、對(duì)采集的信息進(jìn)行審核并入庫(kù),點(diǎn)擊“入庫(kù)全部信息按鈕”:

6、確定操作:

7、信息入庫(kù)完畢提示:

信息入庫(kù)完畢后下來(lái)點(diǎn)擊”管理信息“:

我們可以看到剛剛采集入庫(kù)的新聞信息:

最后到“數(shù)據(jù)更新”刷新首頁(yè)、欄目、和內(nèi)容頁(yè)就可以完成網(wǎng)站的信息采集了。由于帝國(guó)cms采集功能非常強(qiáng)大,一時(shí)半刻也說(shuō)不完,下一頁(yè)將繼續(xù)講解其他功能的使用和技巧。
相關(guān)文章
帝國(guó)CMS根據(jù)內(nèi)容正文字段[newstext]批量獲取描述簡(jiǎn)介字段[smalltext]的
這篇文章主要介紹了帝國(guó)CMS根據(jù)內(nèi)容正文字段[newstext]批量重新生成簡(jiǎn)介字段[smalltext]的方法,需要的朋友可以參考下2023-06-26帝國(guó)CMS 7.2和7.5適用的火車頭采集免登陸發(fā)布模塊配置方法詳解(親測(cè)可
帝國(guó)cms7.2版本開(kāi)始增加了金剛模式,登錄發(fā)布有難度。親測(cè)可用的帝國(guó)CMS 7.2/7.5適用免登陸新聞發(fā)布模塊插件配合火車采集器,可以解決這類問(wèn)題??胺Q完美2022-04-21帝國(guó)cms高危SQL注入漏洞(盲注)系統(tǒng)自帶RepPIntvar過(guò)濾函數(shù)使用方法
帝國(guó)cms開(kāi)發(fā)的時(shí)候要注意一些危險(xiǎn)的注入漏洞,防止被黑,RepPIntvar為系統(tǒng)自帶函數(shù)可以起到過(guò)濾字符的作用,下面就為大家介紹一下使用方法2021-07-26帝國(guó)cms后臺(tái)啟用SESSION驗(yàn)證增加安全性
帝國(guó)cms后臺(tái)啟用SESSION驗(yàn)證所有的登錄信息都是保存在服務(wù)器端的,尤其是公共場(chǎng)所登錄用默認(rèn)的cookies是不安全的2021-07-26帝國(guó)CMS7.2版升級(jí)到7.5版的詳細(xì)步驟方法(已測(cè))
最近需要將老版本的帝國(guó)cms將7.2升級(jí)到7.5版本,參考這篇文章完美升級(jí),特分享一下給需要的朋友2020-08-02帝國(guó)cms常用標(biāo)簽調(diào)用方法(靈動(dòng)標(biāo)簽和萬(wàn)能標(biāo)簽的調(diào)用方法)
整理了一些常用的帝國(guó)CMS調(diào)用,靈動(dòng)標(biāo)簽和萬(wàn)能標(biāo)簽的調(diào)用方法舉例,包括幻燈片、標(biāo)題、一級(jí)欄目、二級(jí)欄目、帶模版的友情鏈接(下拉菜單)、判斷內(nèi)容頁(yè)字段為空時(shí)是如何調(diào)用2020-02-04帝國(guó)cms網(wǎng)站地圖sitemap.xml的制作方法
這篇文章主要介紹了帝國(guó)cms網(wǎng)站地圖sitemap.xml的制作方法,需要的朋友可以參考下2020-02-04帝國(guó)CMS數(shù)據(jù)更新中心設(shè)置教程(更新網(wǎng)站細(xì)節(jié))
在使用帝國(guó)cms的時(shí)候有時(shí)候需要把前臺(tái)數(shù)據(jù)都更新一下,那么就可以參考下面的文章了,要不漏掉了部分就達(dá)不到更新的目地了2020-02-04帝國(guó)CMS后臺(tái)登錄界面及后臺(tái)界面修改方法
今天接到網(wǎng)友詢問(wèn)怎么修改后臺(tái)登錄界面及后臺(tái)界面,特把方法分享出來(lái)需要的朋友可以參考下2020-02-04- 最近仿站團(tuán)隊(duì)接到很多仿站客戶訂單,這里面有一個(gè)這樣的功能,表單提交,今天花時(shí)間寫個(gè)教程給大家,需要的朋友可以參考下2020-02-02