百度收錄為什么只顯示域名,不顯示標(biāo)題?
發(fā)布時(shí)間:2012-11-22 00:26:25 作者:佚名
我要評(píng)論

今天搜索網(wǎng)站時(shí)發(fā)現(xiàn)主頁(yè)竟然沒(méi)有標(biāo)題,很奇怪的問(wèn)題,特查找資料,看看是什么原因?qū)е?/div>
作為網(wǎng)上創(chuàng)業(yè)的一個(gè)項(xiàng)目,新上馬的一個(gè)網(wǎng)站,上馬網(wǎng)站第一天提交,第二天就收錄首頁(yè),并且品牌關(guān)鍵詞又不錯(cuò)的排名。但是第三天出現(xiàn)了一個(gè)問(wèn)題,就是百度快照變成了只剩下網(wǎng)址了,而且快照內(nèi)容是空白
早上SITE,百度收錄,到了晚上SITE,就發(fā)現(xiàn)被K了,到第二天早上,SITE一下,有收錄,還是只有網(wǎng)址,同時(shí)關(guān)鍵詞排名消失!這樣的情況到現(xiàn)在維持了有一個(gè)禮拜左右了,但是快照仍舊是只顯示網(wǎng)址。
出現(xiàn)這個(gè)問(wèn)題,開(kāi)始的時(shí)候心理不進(jìn)害怕,難道網(wǎng)站剛上線就受到百度的懲罰了?心理不免疑問(wèn),網(wǎng)站也沒(méi)有違規(guī)操作,外鏈只是手工發(fā)了幾條,并沒(méi)有過(guò)激行為。
在百度上查找,發(fā)現(xiàn)有同學(xué)出現(xiàn)相同的問(wèn)題,但是并沒(méi)有找到有效的解決辦法。在谷歌搜索的時(shí)候,看到一個(gè)問(wèn)題,就是大家都知道淘寶是屏蔽百度蜘蛛的,可以打開(kāi)淘寶的robots.txt文件看一下,但是在百度搜一下淘寶還是有搜索結(jié)果的,也是只有網(wǎng)址,快照沒(méi)有顯示內(nèi)容
由此我想到,一定是蜘蛛抓取不到網(wǎng)頁(yè)的頁(yè)面內(nèi)容所致,而阻擋百度蜘蛛的一定就是robots.txt,我突然想起來(lái),由于中間我換了后臺(tái)的CPS,根目錄下的文件夾有變化,就把robots.txt內(nèi)容修改過(guò),我想這可能是百度蜘蛛抓取不到頁(yè)面的原因,因?yàn)榘俣葘?duì)robots.txt的反應(yīng)是有一段時(shí)間的。但是我又在想,這次改動(dòng),并沒(méi)有禁止過(guò)蜘蛛爬行的語(yǔ)句。我心里覺(jué)得問(wèn)題還不在于這次改動(dòng)。
我有個(gè)習(xí)慣,就是在百度正式上馬之前,習(xí)慣用robots.txt禁止蜘蛛爬行,為的是怕蜘蛛提前收錄未架構(gòu)好的網(wǎng)站,想吧網(wǎng)站架構(gòu)好之后,在完全放開(kāi)。這個(gè)習(xí)慣的初衷是好的,對(duì)于谷歌是絕對(duì)沒(méi)問(wèn)題的。但是大家都知道,百度是比較弱智的,在更新方面也是比較遲鈍的,根據(jù)大家的經(jīng)驗(yàn),百度對(duì) robots.txt的反應(yīng)是有一段時(shí)間的,因此我斷定,我的網(wǎng)站,百度還是認(rèn)為在之前的robots禁止?fàn)顟B(tài)。如果不出意外的話,過(guò)了這段適應(yīng)期,百度是會(huì)重新收錄的,因?yàn)榇藭r(shí)我的robots文件是正常的。
由此次問(wèn)題看出,提前禁止百度蜘蛛爬行,對(duì)于百度未必是好的方法,最好的方式,就是在網(wǎng)站上嗎之前,提前做好整個(gè)企劃,網(wǎng)站構(gòu)建在盡量短的時(shí)間內(nèi)完成,而不是像我之前,先禁止蜘蛛爬行,然后網(wǎng)址慢慢完善,這樣就有可能出現(xiàn),百度對(duì)之前的robots.txt禁止?fàn)顟B(tài)長(zhǎng)時(shí)間反應(yīng)不過(guò)來(lái),就會(huì)造成百度只收錄網(wǎng)址,快照顯示空白的情況發(fā)生。
下面是找到的兩個(gè),看起來(lái)比較靠譜的原因:
一是,空間質(zhì)量不好,百度蜘蛛抓取首頁(yè)有誤,導(dǎo)致快照空白。(我使用的空間良好,不存在這個(gè)問(wèn)題,因此不是這個(gè)原因)。
二是,網(wǎng)站首頁(yè)程序的原因。
仔細(xì)查看網(wǎng)站程序后臺(tái)設(shè)置和前臺(tái)文件,發(fā)現(xiàn)首頁(yè)有兩個(gè)文件,一個(gè)是index.asp,另一個(gè)是index.html,而空間配置的默認(rèn)首頁(yè)文件是 index.html照常理應(yīng)該是優(yōu)先訪問(wèn)index.html的,這個(gè)是靜態(tài)文件,出于安全起見(jiàn)先把index.asp暫停使用,對(duì)于網(wǎng)站的訪問(wèn)和后臺(tái)的文件生成沒(méi)有影響,于是將index.asp刪除掉,等待收錄情況。第二天早上用站長(zhǎng)工具查詢時(shí)發(fā)現(xiàn)首頁(yè)快照收錄正常,快照日期是最新的,快照內(nèi)容也有了,標(biāo)題的收錄也完整了。至此,百度快照收錄空白內(nèi)容的情況已完全解決。
對(duì)于這個(gè)原因,我曾以為我就是這個(gè)原因,因?yàn)樵鼡Q了我的首頁(yè)文件,因?yàn)楣δ苄枰?,我把index.html修改為index.php了,這樣就有可能是百度一直收錄的我的html首頁(yè),而不收我的php。但是我也做出否定,因?yàn)槲乙呀?jīng)刪除index.html,我的后臺(tái)只有index.php這個(gè)首頁(yè)文件,不存在蜘蛛收錄一個(gè)不存在的首頁(yè)的情況。除非首頁(yè)還在百度的緩存中,但是已經(jīng)一個(gè)禮拜了,k了收,收了k,快照隔天??臻g后臺(tái)也是把 index.php作為默認(rèn)首頁(yè)。
因此,唯一讓我認(rèn)可的還是曾經(jīng)使用robots文件禁用過(guò)百度蜘蛛的原因,百度比較呆,看別人的案例,有的情況是,禁止爬行發(fā)開(kāi)后,四十多天才會(huì)重新收錄的案例。因?yàn)槲艺J(rèn)為,可能是百度蜘蛛對(duì)robots的反應(yīng)慢,依然認(rèn)為是在被禁止。下面是我搜索遇到的一種說(shuō)法:
這個(gè)現(xiàn)象目前主要有幾種可能
2.百度對(duì)robots的更新 要一段時(shí)間, 如果要讓其更快反映,請(qǐng)先刪除robots.txt ,猜測(cè) 之前禁止過(guò)蜘蛛。
我暫時(shí)先認(rèn)可這種辦法,先吧robots文件刪除,以圖百度快點(diǎn)反應(yīng)過(guò)來(lái),重新收錄首頁(yè)!有沒(méi)有效果,后期會(huì)在這篇文章末尾補(bǔ)充。
補(bǔ)充:就在剛剛這篇文章完成之時(shí),我回頭SITE了一下,發(fā)現(xiàn)快照竟然恢復(fù)了,
我不知道是我今天投訴快照的原因,還是,我把后臺(tái)的默認(rèn)首頁(yè),全都刪掉的原因,如果能保持長(zhǎng)久不再恢復(fù)的話,那就是默認(rèn)首頁(yè)的問(wèn)題了,但是我還是覺(jué)得,可能是今天投訴快照的原因。拭目以待,繼續(xù)觀察中……
早上SITE,百度收錄,到了晚上SITE,就發(fā)現(xiàn)被K了,到第二天早上,SITE一下,有收錄,還是只有網(wǎng)址,同時(shí)關(guān)鍵詞排名消失!這樣的情況到現(xiàn)在維持了有一個(gè)禮拜左右了,但是快照仍舊是只顯示網(wǎng)址。
出現(xiàn)這個(gè)問(wèn)題,開(kāi)始的時(shí)候心理不進(jìn)害怕,難道網(wǎng)站剛上線就受到百度的懲罰了?心理不免疑問(wèn),網(wǎng)站也沒(méi)有違規(guī)操作,外鏈只是手工發(fā)了幾條,并沒(méi)有過(guò)激行為。
在百度上查找,發(fā)現(xiàn)有同學(xué)出現(xiàn)相同的問(wèn)題,但是并沒(méi)有找到有效的解決辦法。在谷歌搜索的時(shí)候,看到一個(gè)問(wèn)題,就是大家都知道淘寶是屏蔽百度蜘蛛的,可以打開(kāi)淘寶的robots.txt文件看一下,但是在百度搜一下淘寶還是有搜索結(jié)果的,也是只有網(wǎng)址,快照沒(méi)有顯示內(nèi)容
由此我想到,一定是蜘蛛抓取不到網(wǎng)頁(yè)的頁(yè)面內(nèi)容所致,而阻擋百度蜘蛛的一定就是robots.txt,我突然想起來(lái),由于中間我換了后臺(tái)的CPS,根目錄下的文件夾有變化,就把robots.txt內(nèi)容修改過(guò),我想這可能是百度蜘蛛抓取不到頁(yè)面的原因,因?yàn)榘俣葘?duì)robots.txt的反應(yīng)是有一段時(shí)間的。但是我又在想,這次改動(dòng),并沒(méi)有禁止過(guò)蜘蛛爬行的語(yǔ)句。我心里覺(jué)得問(wèn)題還不在于這次改動(dòng)。
我有個(gè)習(xí)慣,就是在百度正式上馬之前,習(xí)慣用robots.txt禁止蜘蛛爬行,為的是怕蜘蛛提前收錄未架構(gòu)好的網(wǎng)站,想吧網(wǎng)站架構(gòu)好之后,在完全放開(kāi)。這個(gè)習(xí)慣的初衷是好的,對(duì)于谷歌是絕對(duì)沒(méi)問(wèn)題的。但是大家都知道,百度是比較弱智的,在更新方面也是比較遲鈍的,根據(jù)大家的經(jīng)驗(yàn),百度對(duì) robots.txt的反應(yīng)是有一段時(shí)間的,因此我斷定,我的網(wǎng)站,百度還是認(rèn)為在之前的robots禁止?fàn)顟B(tài)。如果不出意外的話,過(guò)了這段適應(yīng)期,百度是會(huì)重新收錄的,因?yàn)榇藭r(shí)我的robots文件是正常的。
由此次問(wèn)題看出,提前禁止百度蜘蛛爬行,對(duì)于百度未必是好的方法,最好的方式,就是在網(wǎng)站上嗎之前,提前做好整個(gè)企劃,網(wǎng)站構(gòu)建在盡量短的時(shí)間內(nèi)完成,而不是像我之前,先禁止蜘蛛爬行,然后網(wǎng)址慢慢完善,這樣就有可能出現(xiàn),百度對(duì)之前的robots.txt禁止?fàn)顟B(tài)長(zhǎng)時(shí)間反應(yīng)不過(guò)來(lái),就會(huì)造成百度只收錄網(wǎng)址,快照顯示空白的情況發(fā)生。
下面是找到的兩個(gè),看起來(lái)比較靠譜的原因:
一是,空間質(zhì)量不好,百度蜘蛛抓取首頁(yè)有誤,導(dǎo)致快照空白。(我使用的空間良好,不存在這個(gè)問(wèn)題,因此不是這個(gè)原因)。
二是,網(wǎng)站首頁(yè)程序的原因。
仔細(xì)查看網(wǎng)站程序后臺(tái)設(shè)置和前臺(tái)文件,發(fā)現(xiàn)首頁(yè)有兩個(gè)文件,一個(gè)是index.asp,另一個(gè)是index.html,而空間配置的默認(rèn)首頁(yè)文件是 index.html照常理應(yīng)該是優(yōu)先訪問(wèn)index.html的,這個(gè)是靜態(tài)文件,出于安全起見(jiàn)先把index.asp暫停使用,對(duì)于網(wǎng)站的訪問(wèn)和后臺(tái)的文件生成沒(méi)有影響,于是將index.asp刪除掉,等待收錄情況。第二天早上用站長(zhǎng)工具查詢時(shí)發(fā)現(xiàn)首頁(yè)快照收錄正常,快照日期是最新的,快照內(nèi)容也有了,標(biāo)題的收錄也完整了。至此,百度快照收錄空白內(nèi)容的情況已完全解決。
對(duì)于這個(gè)原因,我曾以為我就是這個(gè)原因,因?yàn)樵鼡Q了我的首頁(yè)文件,因?yàn)楣δ苄枰?,我把index.html修改為index.php了,這樣就有可能是百度一直收錄的我的html首頁(yè),而不收我的php。但是我也做出否定,因?yàn)槲乙呀?jīng)刪除index.html,我的后臺(tái)只有index.php這個(gè)首頁(yè)文件,不存在蜘蛛收錄一個(gè)不存在的首頁(yè)的情況。除非首頁(yè)還在百度的緩存中,但是已經(jīng)一個(gè)禮拜了,k了收,收了k,快照隔天??臻g后臺(tái)也是把 index.php作為默認(rèn)首頁(yè)。
因此,唯一讓我認(rèn)可的還是曾經(jīng)使用robots文件禁用過(guò)百度蜘蛛的原因,百度比較呆,看別人的案例,有的情況是,禁止爬行發(fā)開(kāi)后,四十多天才會(huì)重新收錄的案例。因?yàn)槲艺J(rèn)為,可能是百度蜘蛛對(duì)robots的反應(yīng)慢,依然認(rèn)為是在被禁止。下面是我搜索遇到的一種說(shuō)法:
這個(gè)現(xiàn)象目前主要有幾種可能
2.百度對(duì)robots的更新 要一段時(shí)間, 如果要讓其更快反映,請(qǐng)先刪除robots.txt ,猜測(cè) 之前禁止過(guò)蜘蛛。
我暫時(shí)先認(rèn)可這種辦法,先吧robots文件刪除,以圖百度快點(diǎn)反應(yīng)過(guò)來(lái),重新收錄首頁(yè)!有沒(méi)有效果,后期會(huì)在這篇文章末尾補(bǔ)充。
補(bǔ)充:就在剛剛這篇文章完成之時(shí),我回頭SITE了一下,發(fā)現(xiàn)快照竟然恢復(fù)了,
我不知道是我今天投訴快照的原因,還是,我把后臺(tái)的默認(rèn)首頁(yè),全都刪掉的原因,如果能保持長(zhǎng)久不再恢復(fù)的話,那就是默認(rèn)首頁(yè)的問(wèn)題了,但是我還是覺(jué)得,可能是今天投訴快照的原因。拭目以待,繼續(xù)觀察中……
相關(guān)文章
- 一、基本概念 什么是Canvas <canvas> 是一個(gè)新的 HTML 元素,這個(gè)元素在 HTML5 中被定義。這個(gè)元素通??梢员挥脕?lái)在 HTML&2009-07-07
dedecms圖片相對(duì)地址和絕對(duì)地址的問(wèn)題
關(guān)鍵字描述: 如何將<p align="left"><img alt="" src="/uploads/allimg/090429/105K52042-0.jpg" /></p> 圖片2009-06-06站長(zhǎng)工具箱 Webmaster Toolbox 收錄查詢
站長(zhǎng)工具箱 Webmaster Toolbox 是一個(gè)用Flash制作的站點(diǎn)綜合信息查詢工具,主要功能是查詢某個(gè)站點(diǎn)的Google Pagerank、Alexa世界排名、Sogou指數(shù)、中國(guó)網(wǎng)站排名,2010-06-01防止網(wǎng)頁(yè)被搜索引擎爬蟲和網(wǎng)頁(yè)采集器收錄的方法匯總
最常規(guī)的防止網(wǎng)頁(yè)被搜索引擎收錄的方法是使用robots.txt,但是這樣做的弊端是要將所有已知的搜索引的爬蟲信息都羅列進(jìn)去,難免有疏漏。2010-07-16- 被亞馬遜收錄,獲得更高的權(quán)重。2012-08-06
- 百度蜘蛛日志抓取解讀 教你如何提高百度收錄:百度的收錄是關(guān)心的重中之重,了解百度蜘蛛的爬行規(guī)律從而更好的改善收錄情況也是必須要掌握的。2010-06-29
- 網(wǎng)站添加百度聯(lián)盟后,是否真的有利于自身網(wǎng)站百度收錄呢?2012-11-19
- 目前百度對(duì)新站收錄相對(duì)越來(lái)越容易,但考察期內(nèi)又增加一些門檻,比如只收錄首頁(yè),快照不更新,收錄了內(nèi)頁(yè)又刪除,有些甚至收錄了首頁(yè)后又完全刪除,徹底在百度里消失,前面2009-07-19
- 查百度網(wǎng)一直將百度與網(wǎng)站的命運(yùn)連接在一起。自上次SEO查詢工具發(fā)布后獲得了廣大站長(zhǎng)的支持。 本次在次發(fā)布百度收錄查詢系統(tǒng)。相信很多站長(zhǎng)都很需要了解到底百度蜘蛛近期內(nèi)2009-03-18
ASP下將文字轉(zhuǎn)換成圖片顯示的代碼 防止采集收錄等
ASP 將文字轉(zhuǎn)換成圖片顯示出來(lái),更利于文字信息的安全,有時(shí)候我們不希望文字的內(nèi)容被搜索引擎抓取到,那么用ASP程序控制轉(zhuǎn)換成圖片格式會(huì)更安全,一個(gè)小實(shí)例,希望對(duì)你有2011-02-15