對話百度站長平臺:SEO實操中的技術(shù)問題

12月30日消息 日前,百度站長平臺2014年最后一場高端沙龍在廣州落下帷幕。本次沙龍圍繞著“搜索引擎優(yōu)化”這一話題展開了一些列的討論。百度站長平臺專家王淘、草根個人站長代表搜外創(chuàng)始人夫唯、以及大型網(wǎng)站代表太平洋SEO負(fù)責(zé)人黃勇一起探討了有關(guān)搜索引擎趨勢,搜索引擎喜好以及工程師們在實操中遇到的技術(shù)問題。
在之前站長之家發(fā)布的文章《對話百度站長平臺:搜索引擎的趨勢和喜好》中分享了搜外創(chuàng)始人夫唯和百度lee代言人王淘關(guān)于搜索引擎趨勢及喜好的對話內(nèi)容。今天要分享的是技術(shù)男們最關(guān)注的SEO實操方面的相關(guān)知識。
延伸閱讀:對話百度站長平臺:搜索引擎的趨勢和喜好
主要內(nèi)容如下:
黃勇:有一天我們有一個網(wǎng)站發(fā)現(xiàn)來了非常多的爬蟲,給服務(wù)器造成了極大的壓力。于是我們緊急屏蔽了所有爬蟲IP和UA??墒堑纫欢螘r間后,我們解除解禁后,卻發(fā)現(xiàn)恢復(fù)起來非常緩慢,基本上兩個月后才回到了當(dāng)時的水平。大家的站越做越大,肯定會遇到龐大的訪問壓力、抓蟲抓取方面的問題,所以想借此機(jī)會咨詢一下,看在這方面有沒有一個好的解決辦法。
王淘:理論上講,站點屏蔽了Baiduspider后的恢復(fù)周期的確比較長,但是有沒有措施就請孫權(quán)講一下了。
孫權(quán):通過封禁UA或IP的方式來拒絕百度蜘蛛,一天以上后果都是非常嚴(yán)重的。就這個問題來說目前沒有快速的方法可以讓你在短時間內(nèi)恢復(fù)。這是站點自身運(yùn)行的一個故障,并不是百度策略上面有什么問題。還有就是,網(wǎng)站在無法訪問期間,很多因子都會受到影響,百度在給網(wǎng)站進(jìn)行綜合打分時會綜合計算多個因子,所以說,即使是網(wǎng)站訪問恢復(fù)了,但其它因子的負(fù)面影響還在,網(wǎng)站恢復(fù)起來也還是非常困難的。
(接上)
觀眾提問:用閉站保護(hù)能解決這個問題嗎?
孫權(quán):不能。閉站保護(hù)前提是把網(wǎng)站死掉,指的是爬蟲不能抓取,同時用戶也訪問不了。。
(接上)
王淘:其實我建議不管對什么樣的IP或者UA都不要直接封禁,設(shè)置502會好一點。
黃勇:當(dāng)時我們也有想過設(shè)置502,但考慮到這個問題不是短期內(nèi)能夠解決的,擔(dān)心使用502被搜索引擎視為欺騙,畢竟是服務(wù)器的問題嘛,應(yīng)該是403,干嘛告訴人家說是502。我們非常害怕因為使用取巧的做法而帶來更嚴(yán)重的后果
王淘:這個還好,如果你網(wǎng)頁明確不想讓搜索引擎訪問就403就好了,如果走屏蔽其實502也無所謂,僅僅是我們浪費流量重新抓幾次,這是比較謹(jǐn)慎的情況。我們抓不到你們內(nèi)容對我們來說也是損失。
(接上)
孫權(quán):可能很多站長會問,為什么我的站持續(xù)一段時間訪問不了后排名會掉得那么厲害,就是因為百度認(rèn)為網(wǎng)站可訪問性有問題,目前百度對可訪問性有問題的網(wǎng)站打壓是非常厲害的。所以,面對網(wǎng)站爬蟲訪問量突增的情況,我不建議站長立刻去封我們的爬蟲,你可以通過百度站長平臺抓取頻次工具,把這個爬蟲壓力調(diào)低,但是不可以封掉。比如本來一天來抓50萬,你調(diào)低到2萬,我們后臺的Spider策略都是認(rèn)這個值的。
黃勇:《301跳轉(zhuǎn)常見問題匯總》文章中提到站點設(shè)置301后,“百度不會刪除舊網(wǎng)頁,新舊網(wǎng)頁同時存在,百度在搜索結(jié)果中會優(yōu)先展現(xiàn)新網(wǎng)頁”,但實際情況是,會發(fā)生新舊頁面交替獲得排名的現(xiàn)象,這是什么原因?
延伸閱讀:301跳轉(zhuǎn)常見問題匯總
王淘:這個問題主要是由我們的系統(tǒng)造成的。我們系統(tǒng)有非常多的模塊,每個模塊都要去單獨處理301更替,偶爾有一些模塊的處理邏輯可能有出現(xiàn)問題,可能出現(xiàn)一些波動。我們在6月份左右時做過一次大規(guī)模的改進(jìn),基本上把所有的模塊都理了一遍,把所有歸一化都做了統(tǒng)一,現(xiàn)在這樣的問題比較少了。
黃勇:百度快照時間與頁面質(zhì)量、抓取更新頻率是否有什么關(guān)系?
王淘:快照時間沒有任何參考價值,在排序時我們使用單獨的抓取時間統(tǒng)計系統(tǒng),外部不可見,站點完全不用關(guān)注百度的快照時間。
黃勇:文章頁的邊欄、底部部署大量與當(dāng)前文章間接相關(guān)的鏈接,是否會認(rèn)被為噪聲?是否影響頁面本身內(nèi)容識別和收錄?
王淘:網(wǎng)頁在建庫時會判斷頁面的主體內(nèi)容,而邊框這部分的內(nèi)容基本不算在內(nèi),所以基本不會有影響,只有一些鏈接發(fā)現(xiàn)的作用。
黃勇:Canonical 的使用范圍,百度提到“高度相似”,這個“高度相似”到底是什么標(biāo)準(zhǔn)?
王淘:“高度相似”是指網(wǎng)站的標(biāo)題、主體內(nèi)容以及網(wǎng)站的結(jié)構(gòu)都相似,從這個案例來看網(wǎng)站結(jié)構(gòu)不同,對Baiduspider來說完全是兩個不同頁面,canonical標(biāo)簽不會生效。
黃勇:請問百度如何看待一個采集了優(yōu)質(zhì)內(nèi)容,但瀏覽體驗和訪問性都好的網(wǎng)站?
王淘:對于百度來說,能夠提供滿足用戶需求的內(nèi)容、有良好用戶體驗的網(wǎng)站就是好網(wǎng)站。有些站點從從外站轉(zhuǎn)載來內(nèi)容,經(jīng)過加工提供了內(nèi)容增益,更好的滿足了用戶需求,同樣可以得到好的展現(xiàn)。
相關(guān)文章
站長必看:2016年新站上線前必做的四大SEO優(yōu)化工作
SEO并不是大家想象的做些優(yōu)化、發(fā)個外鏈、交換友鏈就可以了,那么新站上線前必須要做哪些SEO優(yōu)化工作呢?本文將提供2016年新站上線前必做的四大SEO優(yōu)化工作供大家了解,希2015-12-19- 作為一名SEO工作人員,應(yīng)當(dāng)秉承實事求是的態(tài)度去對網(wǎng)站進(jìn)行客觀的分析處理,而不是為了突出SEO的作用和能力,而每天不斷的去對網(wǎng)站做斤斤計較的調(diào)整。今天就來說說那些被無2015-12-16
- 百度廣告聯(lián)盟相信很多站長都不陌生,即使沒有做過,但是一定要稍有了解,很多朋友疑問了,百度廣告聯(lián)名和網(wǎng)站seo能扯上什么關(guān)系?當(dāng)然有關(guān)系,而且關(guān)系還很大,今天我們就2015-12-15
新手站長在建立博客網(wǎng)站時如何做好SEO優(yōu)化?有哪些SEO優(yōu)化技巧?
對于一些初入SEO行業(yè)的從業(yè)者來說,大部分的新人可能會被當(dāng)成外鏈機(jī)器,每天的工作只有發(fā)外鏈、發(fā)外鏈、還是發(fā)外鏈,不管是高質(zhì)量的還是低質(zhì)量的外鏈都去發(fā),那么新手站長2015-12-07- 個人站長如何做好全站SEO檢測?下面的文字就給大家詳細(xì)介紹下個人站長做好全站SEO檢測的方法,感興趣的朋友們可以過來看看2014-12-15
- 如今個人站長想要賺點錢確實不容易,沒有強(qiáng)大的資源很難把一個個人站坐到流量很大。沒有流量的站,更不用說賺錢了。在現(xiàn)如今移動互聯(lián)網(wǎng)的崛起,個人站長也是在生死搖籃之間2014-11-08
- 很多站長都在整天研究seo,那看看本文的介紹分享給大家2014-09-17
- 站長大部分都是早期從事一些和互聯(lián)網(wǎng)相關(guān)的工作開始起步的,看看該文能給你帶來什么啟示2014-09-17
- 網(wǎng)上營銷異?;鸨?,在其中最受關(guān)注的是什么?當(dāng)然是seo,但是seo真的只是嘴上說說那么好做的嗎?下面和腳本之家的小編一起來看看一位“自嘲站長”的成長經(jīng)歷,需要的朋友可2014-09-17
- 本篇的站長故事的主人公是一位30多歲的成功人士,他自述了這些年從不從接觸seo到現(xiàn)在是seo老人走過的這幾年的人生經(jīng)歷,需要的朋友可以參考下2014-09-11