文章為什么被重復收錄? 文章被百度重復收錄的原因及解決方法

點擊進入鏈接,除了原網頁,分別出現(xiàn):
http://www.stcash.com/5273/comment-page-1
http://www.stcash.com/5273?replytocom=1989
前面一篇文章居然出現(xiàn)一個三級目錄,后面一篇文章又類似于動態(tài)網頁網址。我文章中是沒有這兩個鏈接地址的,查看網頁源碼,看出了一點端倪。
原因分析:
我發(fā)現(xiàn)了這兩個?replytocom=1989網址的來源:文章評論鏈接
四個評論剛好對應四個replytocom,百度蜘蛛可能有一定的智能,四個replytocom網址中只收錄了一個,但是又不夠智能,沒有區(qū)分出來評論鏈接和原文鏈接對應的文章內容是相同的。
comment-page-1網址同樣是來源于評論鏈接,comment-page-1代表著評論頁面的第一頁。如果我的評論比較多,比如說有1000條評論,那么一頁肯定是顯示不下去的,就會出現(xiàn)comment-page-2,comment-page-3......這就是評論分頁功能,這個功能本質上是防止評論過多時,網頁會被拉的很長,導致網頁加載速度慢和用戶體驗差。但是不巧的是,百度蜘蛛依然不能識別出來這和原文
解決方法:
1、對于comment-page-1重復收錄,有兩種方式解決
1)在wordpress后臺關閉評論分頁
2)修改robots.txt,加上一句項目的代碼
Disallow: /comment-page-
robots.txt在網站根目錄,使用 網址/robots.tx就可以看到設置的結果了。如果根目錄下沒有這個文件
wp-includes/funtion中有這么一段代碼:
- $output = "User-agent: *\n";
- $public = get_option( 'blog_public' );
- if ( '0' == $public ) {
- $output .= "Disallow: /\n";
- } else {
- $site_url = parse_url( site_url() );
- $path = ( !emptyempty( $site_url['path'] ) ) ? $site_url['path'] : '';
- $output .= "Disallow: $path/wp-admin/\n";
- }
在 $output .= "Disallow: $path/wp-admin/\n"; 后面增加一句$output .= "Disallow: $path/comment-page-\n";
2、對于replytocom重復收錄,設置robots.txt文件
Disallow:/*?replytocom=
或者是加上對于包含replytocom的所有鏈接都加上nofollow鏈接
- add_filter('comment_reply_link', 'add_nofollow', 420, 4);
- function add_nofollow($link, $args, $comment, $post){
- return str_replace("href=", "rel='nofollow' href=", $link);
- }
以上就是對文章被百度重復收錄的原因及解決方法全部內容的介紹,更多內容請繼續(xù)關注腳本之家!
相關文章
網站關鍵詞庫如何挖掘和優(yōu)化? 編寫優(yōu)化性質的文章權重不再是夢想
說到網站優(yōu)化大多數(shù)人都在徐吹說自己也會優(yōu)化,可是看到那么多SEO博客、SEO官網等等,出現(xiàn)這一情況,主要原因還是網站關鍵詞庫沒有做好?那么網站關鍵詞庫如何挖掘和優(yōu)化呢2016-02-19你的文章還在被剽竊嗎?如何保護你的原創(chuàng)血淚?
你的文章還在被剽竊嗎?如何保護你的原創(chuàng)血淚?今天這篇文章就為大家詳細介紹一下,對于有需要的朋友快快來參考一下吧2016-02-16如何讓百度加快收錄偽原創(chuàng)的文章? 編寫高質量偽原創(chuàng)的6個方法介紹
文章主要體現(xiàn)在原創(chuàng)的文章,而不是同質非常嚴重的文章,或者偽原創(chuàng)的文章,那么如何讓百度加快收錄偽原創(chuàng)的文章?本文將提供編寫高質量偽原創(chuàng)方法介紹供大家了解,希望對大2016-02-04文章是原創(chuàng)好還是偽原創(chuàng)好?網站文章發(fā)布數(shù)量及偽原創(chuàng)、原創(chuàng)分析
如果網站上大量的內容都是轉載的,搜索引擎就會覺得整個網站沒有多大的價值,從而降低網站權重。網站排名自然也不會很高。辦文章是原創(chuàng)好還是偽原創(chuàng)好?下面就來分析網站文2016-01-28網站文章發(fā)布數(shù)量及偽原創(chuàng)/原創(chuàng)相關問題介紹
今天小編為大家?guī)砹司W站文章發(fā)布數(shù)量及偽原創(chuàng)/原創(chuàng)相關問題介紹,感興趣的朋友們可以跟著小編去下文了解一下哦2016-01-28- 怎么讓文章快速收錄?很多小編發(fā)現(xiàn),自己編輯的文章總是不被收錄,或者收錄的文章還沒有偽原創(chuàng)文章收錄快速,這是怎么回事呢?怎么才能有技巧的討好百度,讓文章快速收錄呢2016-01-28
seoer如何讓自己的原創(chuàng)文章受到站長的關注和歡迎
今天小編為大家?guī)砹藄eoer如何讓自己的原創(chuàng)文章受到站長的關注和歡迎相關內容的介紹,感興趣的朋友們可以跟著小編去下文了解一下哦2016-01-27如何提高原創(chuàng)文章的可閱讀性? SEO優(yōu)化網站之寫原創(chuàng)文章需要注意的幾個
前期的SEO只是簡單的做做網站關鍵詞,對內容的錨文本進行處理,交換友情鏈接和采集內容發(fā)布等,而原創(chuàng)文章的書寫需要注意什么呢?本文將提供SEO優(yōu)化網站之寫原創(chuàng)文章需要注2016-01-22這家互聯(lián)網媒體年收入超200萬美元 每天卻僅更新2篇文章
你可以想想嘛,有家明教The Information每年的收入都超200萬美元,但是每天卻只發(fā)2篇文章給觀眾,最牛的就是,你需要訂閱才可以看到他們的內容,它是怎么做到的呢?這種模2016-01-19- 今天小編為大家分享真正的優(yōu)質文章應該遵循的四個基本要素,這對于網站建設來說是非常重要的,所以推薦過來,有需要的朋友可以參考一下哦2016-01-19