什么是“網(wǎng)站內容重復” 又該如何進行消除
發(fā)布時間:2013-07-23 16:28:28 作者:佚名
我要評論

網(wǎng)站內容重復,是百度K站的一個主要原因,但是也有一些人并不知道什么情況才算網(wǎng)站內容重復,也不知道如何解決網(wǎng)站內容重復的問題。筆者認為網(wǎng)站內容重復不單單是指網(wǎng)站本身出現(xiàn)了兩篇或者多篇一樣的文章,還包括很多方面,本文就幾個常見的情況進行介紹,有不足的地方
一、網(wǎng)站內容重復的情況:
1、同樣一篇文章出現(xiàn)多個URL,即使這篇文章屬于原創(chuàng),也會被百度給予懲罰
2、網(wǎng)站內容多為采集,這種網(wǎng)站內容重復會被當做采集站直接被百度處理掉,百度新的綠蘿算法就是專門打擊采集站點的。
3、網(wǎng)站的固定版塊出現(xiàn)次數(shù)太多,很多網(wǎng)站的右側總是固定放一些版塊或欄目,這些欄目的內容從來不進行更新,或者各個頁面的右側都是前篇一律的內容,就會造成頁面重復度高。
4、未設置404錯誤頁面,當我們刪除某一個頁面的時候,一定要用404狀態(tài)碼給予用戶和蜘蛛一定的提示,如果代碼設置錯誤,那么刪除的頁面在蜘蛛那里是假想存在的,由此一來就會多次收錄。
5、動態(tài)頁面和靜態(tài)并存,百度爬去目錄時收錄了大量動態(tài)頁面
6、網(wǎng)站內容以圖片為主,文字很少,很多圖片都是共用一個URL地址,這樣一來蜘蛛在索引的時候很難保證不被重復收錄。
重復內容是指不同的URL鏈接內容卻是相同的,同時收錄多個重復頁面,設置多個頁面進行介紹,但是網(wǎng)頁的大體內容是相同的,這樣處理的方法是錯誤的。
二、重復內容的檢測方法
1、對于檢測一篇文章是否重復內容,title:+文章標題可找出相同的文章。
2、從文中摘取一段話,在百度搜一下,出現(xiàn)大量紅字,表明這篇文章的重復度高
3、站內搜索,可以找到出現(xiàn)多次的內容。
4、利用一些頁面相似度檢查工具,判斷一些相鄰頁面的相似度,80%以上相似度就需要對一些固定欄目進行處理。
三、如何消除重復內容
1、原創(chuàng)內容的增加
對于網(wǎng)站內容多為采集或簡單偽原創(chuàng)的網(wǎng)站,企贏001建議增加原創(chuàng)文章的內容,寧可百度收錄少一些,也不要讓百度把之前收錄的文章吐出來。
2、網(wǎng)站固定欄目內容隨機展示
可以根據(jù)正文的關鍵詞,隨機調用右側欄目的文章內容,讓每一個頁面都有不一樣的內容,避免大量頁面相似度高的情況出現(xiàn)。
3、設置404頁面
告知用戶和搜索引擎某些頁面不存在了,防止搜索引擎收錄大量死鏈。
4、頁面設置獨立的Meta標簽
關鍵詞、標簽、描述,每一個頁面都需要不同,可以采用手動修改,或者根據(jù)一定的規(guī)則設置。
1、同樣一篇文章出現(xiàn)多個URL,即使這篇文章屬于原創(chuàng),也會被百度給予懲罰
2、網(wǎng)站內容多為采集,這種網(wǎng)站內容重復會被當做采集站直接被百度處理掉,百度新的綠蘿算法就是專門打擊采集站點的。
3、網(wǎng)站的固定版塊出現(xiàn)次數(shù)太多,很多網(wǎng)站的右側總是固定放一些版塊或欄目,這些欄目的內容從來不進行更新,或者各個頁面的右側都是前篇一律的內容,就會造成頁面重復度高。
4、未設置404錯誤頁面,當我們刪除某一個頁面的時候,一定要用404狀態(tài)碼給予用戶和蜘蛛一定的提示,如果代碼設置錯誤,那么刪除的頁面在蜘蛛那里是假想存在的,由此一來就會多次收錄。
5、動態(tài)頁面和靜態(tài)并存,百度爬去目錄時收錄了大量動態(tài)頁面
6、網(wǎng)站內容以圖片為主,文字很少,很多圖片都是共用一個URL地址,這樣一來蜘蛛在索引的時候很難保證不被重復收錄。
重復內容是指不同的URL鏈接內容卻是相同的,同時收錄多個重復頁面,設置多個頁面進行介紹,但是網(wǎng)頁的大體內容是相同的,這樣處理的方法是錯誤的。
二、重復內容的檢測方法
1、對于檢測一篇文章是否重復內容,title:+文章標題可找出相同的文章。
2、從文中摘取一段話,在百度搜一下,出現(xiàn)大量紅字,表明這篇文章的重復度高
3、站內搜索,可以找到出現(xiàn)多次的內容。
4、利用一些頁面相似度檢查工具,判斷一些相鄰頁面的相似度,80%以上相似度就需要對一些固定欄目進行處理。
三、如何消除重復內容
1、原創(chuàng)內容的增加
對于網(wǎng)站內容多為采集或簡單偽原創(chuàng)的網(wǎng)站,企贏001建議增加原創(chuàng)文章的內容,寧可百度收錄少一些,也不要讓百度把之前收錄的文章吐出來。
2、網(wǎng)站固定欄目內容隨機展示
可以根據(jù)正文的關鍵詞,隨機調用右側欄目的文章內容,讓每一個頁面都有不一樣的內容,避免大量頁面相似度高的情況出現(xiàn)。
3、設置404頁面
告知用戶和搜索引擎某些頁面不存在了,防止搜索引擎收錄大量死鏈。
4、頁面設置獨立的Meta標簽
關鍵詞、標簽、描述,每一個頁面都需要不同,可以采用手動修改,或者根據(jù)一定的規(guī)則設置。
相關文章
- 怎么避免網(wǎng)站大量重復URL被百度收錄?很多站長發(fā)現(xiàn),自己的網(wǎng)站出現(xiàn)大量的重復收錄,這對萬展有很大影響,該怎么避免網(wǎng)站中的網(wǎng)頁被重復收錄呢?請看下文詳細介紹2016-01-12
- 一篇文章被三次重復收錄,這一現(xiàn)象無論是對于讀者還是對于搜索引擎都是不好的,一篇同樣文章被收錄三次,另外兩篇就成了"垃圾"了么?文章為什么被重復收錄?本文將提供文章2016-01-06
網(wǎng)站內容過度重復該怎么辦? 一個標簽解決內容重復高的問題
網(wǎng)站內容過度重復該怎么辦?最近網(wǎng)站總是出現(xiàn)內容重復度過高的問題,該怎么辦呢?網(wǎng)站出現(xiàn)的收錄可能會是加后綴的網(wǎng)頁,最好給url加上后綴,下面我們以虎嗅網(wǎng)為例,給大家2015-12-18優(yōu)化過程中關鍵詞重復和關鍵詞廣度有什么區(qū)別?
很多人都不知道關鍵詞重復和關鍵詞廣度有什么區(qū)別?關鍵詞重復是指相同的關鍵詞在大量不同的頁面中出現(xiàn),而關鍵詞廣度是指在一個頁面中布局大量不同的關鍵詞,下面我們來看2014-12-02- 朋友圈里有很多代購的,綜合看一下代購什么的最多?當然是面膜,為什么這么多產(chǎn)品偏偏選擇面膜呢?這也是營銷中產(chǎn)品選擇的厲害之處,面膜消耗快且能重復消費,需要的朋友可2014-10-10
- 做網(wǎng)站SEO優(yōu)化的站長朋友應該都比較忌諱自己網(wǎng)站中存在與其他同行網(wǎng)站相同的信息,這也是我們做SEO 工作時應該盡量避免出現(xiàn)的情況2014-04-15
怎么解決wordpress分頁title標題重復不利于SEO的問題
在使用谷歌管理員工具時發(fā)現(xiàn)wordpress博客列表文章分頁重復56頁,肯定是對SEO十分不利,那怎么解決這個問題呢?下文給出的解決辦法供大家參考2014-01-12互聯(lián)網(wǎng)電子公告服務專項審批取消原因是重復審批
這次取消的行政審批項目主要分5種情況:一是屬于重復審批的項目。經(jīng)營性互聯(lián)網(wǎng)信息服務許可和非經(jīng)營性互聯(lián)網(wǎng)信息服務備案”已包含了互聯(lián)網(wǎng)電子公告服務專項審批(備案)。2010-07-17- 現(xiàn)在的互聯(lián)網(wǎng)魚龍混雜,信息龐大而繁瑣,各類信息充斥著互聯(lián)網(wǎng)。然而大量的重復信息卻不斷的上演著,但是這種事情并沒法去終止,或者說不可避免。2010-02-07
- 信息是不斷涌來的水,互聯(lián)網(wǎng)承載著信息之水日夜流淌。而網(wǎng)站編輯就是將這些信息內容根據(jù)我們站的定位一條一條的,一天一天的呈現(xiàn)在我們的網(wǎng)站上。2010-02-01