網(wǎng)站優(yōu)化 搜索引擎收錄網(wǎng)頁(yè)的四個(gè)階段

作為SEO從業(yè)者,不僅要被搜索引擎抓取,還要被收錄,最重要的是在收錄后有良好的排名,本文將簡(jiǎn)單分析下搜索引擎收錄網(wǎng)頁(yè)的四個(gè)階段。每個(gè)網(wǎng)站、每個(gè)網(wǎng)頁(yè)的排名都是不一樣的,看看你的網(wǎng)站處于哪個(gè)階段呢?
網(wǎng)頁(yè)收錄第一階段:大小通吃
搜索引擎的網(wǎng)頁(yè)抓取都是采取「大小通吃」的策略,也就是把網(wǎng)頁(yè)中能發(fā)現(xiàn)的鏈接逐一加入到待抓取URL中,機(jī)械性的將新抓取的網(wǎng)頁(yè)中的URL提取出來(lái),這種方式雖然比較古老,但效果很好,這就是為什么很多站長(zhǎng)反應(yīng)蜘蛛來(lái)訪問(wèn)了,但沒(méi)有收錄的原因,這僅僅是第一階段。
網(wǎng)頁(yè)收錄第二階段:網(wǎng)頁(yè)評(píng)級(jí)
而第二階段則是對(duì)網(wǎng)頁(yè)的重要性進(jìn)行評(píng)級(jí),PageRank是一種著名的鏈接分析算法,可以用來(lái)衡量網(wǎng)頁(yè)的重要性,很自然的,站長(zhǎng)可以用PageRank的思路來(lái)對(duì)URL進(jìn)行排序,這就是各位熱衷的「發(fā)外鏈」,據(jù)一位朋友了解,在中國(guó)「發(fā)外鏈」這個(gè)市場(chǎng)每年有上億元的規(guī)模。
爬蟲(chóng)的目的就是去下載網(wǎng)頁(yè),但PageRank是個(gè)全局性算法,也就是當(dāng)所有網(wǎng)頁(yè)有下載完成后,其計(jì)算結(jié)果才是可靠的。對(duì)于中小網(wǎng)站來(lái)講,服務(wù)器如果質(zhì)量不好,如果在抓取過(guò)程中,只看到部分內(nèi)容,在抓取階段是無(wú)法獲得可靠的PageRank得分。
網(wǎng)頁(yè)收錄第三階段:OCIP策略
OCIP策略更像是PageRank算法的改進(jìn)。在算法開(kāi)始之前,每個(gè)網(wǎng)頁(yè)都給予相同的「現(xiàn)金」,每當(dāng)下載某個(gè)頁(yè)面A后,A將自己的「現(xiàn)金」平均分給頁(yè)面中包含的鏈接頁(yè)面,把自己的「現(xiàn)金」清空。這就是為什么導(dǎo)出的鏈接越少,權(quán)重會(huì)越高的原因之一。
而對(duì)于待抓取的網(wǎng)頁(yè),會(huì)根據(jù)手頭擁有的現(xiàn)金多少排序,優(yōu)先下載現(xiàn)金最充裕的網(wǎng)頁(yè),OCIP大致與PageRank思路一致,區(qū)別在于:PageRank每次要迭代計(jì)算,而OCIP則不需要,所以計(jì)算速度遠(yuǎn)遠(yuǎn)快于PageRank,適合實(shí)時(shí)計(jì)算使用。這可能就是為什么很多網(wǎng)頁(yè)會(huì)出現(xiàn)「秒收」的情況了。
網(wǎng)頁(yè)收錄第四階段:大站優(yōu)先策略
大站優(yōu)先的思路很直接,以網(wǎng)站為單位來(lái)衡量網(wǎng)頁(yè)的重要性,對(duì)于待抓取的URL隊(duì)列中的網(wǎng)頁(yè),根據(jù)所述網(wǎng)站歸類(lèi),如果哪個(gè)網(wǎng)站等待下載的頁(yè)面最多,則優(yōu)先下載這些鏈接。其本質(zhì)思想是「傾向于優(yōu)先下載大型網(wǎng)站URL」。因?yàn)榇笮途W(wǎng)站往往包含更多的頁(yè)面。鑒于大型網(wǎng)站往往是名站,其網(wǎng)頁(yè)質(zhì)量一般較高,所以這個(gè)思路雖然簡(jiǎn)單,但有一定依據(jù)。
實(shí)驗(yàn)表明這個(gè)算法雖然簡(jiǎn)單粗暴,但卻能收錄高質(zhì)量網(wǎng)頁(yè),很有效果。這也是為什么許多網(wǎng)站的內(nèi)容被轉(zhuǎn)載后,大站卻能排到你前面的最重要原因之一。
相關(guān)文章
移動(dòng)版Wap網(wǎng)頁(yè)針對(duì)百度進(jìn)行SEO優(yōu)化的一些要點(diǎn)總結(jié)
這篇文章主要介紹了移動(dòng)版Wap網(wǎng)站針對(duì)百度進(jìn)行SEO優(yōu)化的一些要點(diǎn)總結(jié),包括內(nèi)鏈和URL網(wǎng)址的設(shè)置等關(guān)鍵點(diǎn)的講解,需要的朋友可以參考下2016-03-01移動(dòng)網(wǎng)站該如何優(yōu)化? 移動(dòng)網(wǎng)頁(yè)搜索引擎優(yōu)化的十個(gè)細(xì)節(jié)
移動(dòng)搜索引擎優(yōu)化不僅僅只是給移動(dòng)站排名,更重要的是還與PC網(wǎng)站排名有很密切的關(guān)系,那么移動(dòng)網(wǎng)站該怎么優(yōu)化呢?移動(dòng)網(wǎng)站在優(yōu)化過(guò)程中需要注意什么呢?本文將提供移動(dòng)網(wǎng)頁(yè)2016-01-27網(wǎng)頁(yè)改版實(shí)戰(zhàn)!日本設(shè)計(jì)師如何徹底優(yōu)化招聘網(wǎng)站?
昨天推薦了一款熱點(diǎn)圖神器,今天繼續(xù)拿一個(gè)日本招聘網(wǎng)站開(kāi)刀,從實(shí)戰(zhàn)角度給同學(xué)們演示如何全方位優(yōu)化整個(gè)網(wǎng)站,改善思路同樣非常值得借鑒,滿滿當(dāng)當(dāng)?shù)母韶涄s緊來(lái)收!2015-01-15網(wǎng)頁(yè)改版實(shí)戰(zhàn):日本設(shè)計(jì)師如何徹底優(yōu)化旅游網(wǎng)站?
今天我們將對(duì)一個(gè)旅游網(wǎng)站進(jìn)行徹底大變身,驚喜的是,借助神器的力量,改造思路非常清晰,改造效果非同一般地好。沒(méi)有改版經(jīng)驗(yàn)的設(shè)計(jì)師,看完你會(huì)回來(lái)轉(zhuǎn)發(fā)的2015-01-13如何用攝影三分法來(lái)優(yōu)化網(wǎng)頁(yè)設(shè)計(jì)?
對(duì)于攝影師而言,取景布局三分法是非常熟悉的概念。盡管它是非常引人入勝的概念,但是在進(jìn)行網(wǎng)頁(yè)設(shè)計(jì)的時(shí)候,幾乎沒(méi)有人會(huì)拿三分法來(lái)說(shuō)事兒。2014-12-31網(wǎng)頁(yè)細(xì)節(jié)優(yōu)化實(shí)戰(zhàn):如何使用熱點(diǎn)圖做優(yōu)化?
許多設(shè)計(jì)師喜歡將自己認(rèn)為創(chuàng)意爆棚的UI設(shè)計(jì)直接應(yīng)用到客戶的網(wǎng)站上,但并沒(méi)有考慮過(guò)這種設(shè)計(jì)是否符合網(wǎng)站的產(chǎn)品,是否符合目標(biāo)用戶群所需要的體驗(yàn)與需求,從這個(gè)角度上來(lái)說(shuō)2014-12-17網(wǎng)頁(yè)加載太慢?使用百度云加速優(yōu)化網(wǎng)站的方法
有的網(wǎng)站打開(kāi)網(wǎng)頁(yè)需要等好長(zhǎng)時(shí)間,沒(méi)耐心的人直接就關(guān)上了,現(xiàn)在同類(lèi)型的網(wǎng)站這么多,看誰(shuí)的不是看啊,有多少網(wǎng)友愿意去等你的網(wǎng)頁(yè)加載好了再看,這個(gè)問(wèn)題可以直接減少好多2014-11-09網(wǎng)站優(yōu)化必看 蜘蛛陷阱 不利于蜘蛛爬取的網(wǎng)頁(yè)
網(wǎng)站有哪些地方是不利于蜘蛛爬取的呢?下面腳本之家分享了一些蜘蛛爬取陷阱,讓蜘蛛爬去不到頁(yè)面的一些因素,需要的朋友可以參考下2014-10-13怎么針對(duì)關(guān)鍵詞進(jìn)行網(wǎng)頁(yè)優(yōu)化
優(yōu)化關(guān)鍵詞在網(wǎng)頁(yè)制作和設(shè)置方面該怎么做?看看下文你就知道了2014-08-29網(wǎng)頁(yè)設(shè)計(jì)與構(gòu)架中的幾個(gè)SEO優(yōu)化原則
網(wǎng)站的流量從客觀上反映了一個(gè)網(wǎng)站的受歡迎程度,流量越大,網(wǎng)站的排名越靠前,社會(huì)影響力也越大,特別是對(duì)網(wǎng)絡(luò)媒體而言,權(quán)威性、公信力也越強(qiáng)。2014-08-20