讓采集網(wǎng)站內(nèi)容更有有價值

站長們應(yīng)該都知道“偽原創(chuàng)”這個詞的含義。現(xiàn)在互聯(lián)網(wǎng)上上下下,都在搞信息抓取,高級的叫垂直搜索,低級的叫采集。不過這次筆者卻要說,同樣是抓取信息做站,性質(zhì)確實(shí)是會不一樣的。有的是剽竊,有的卻是在組織信息。
一個成功的站,要有自己的存在價值。筆者的個人感覺,互聯(lián)網(wǎng)進(jìn)入21世紀(jì)后,重復(fù)內(nèi)容越來越多了。常常在檢索資料時,點(diǎn)了許多鏈接,看到的卻是同樣的內(nèi)容。這些重復(fù)內(nèi)容的制造者們所做的工作,是沒有價值的。只制造重復(fù)內(nèi)容的網(wǎng)站,是被淘汰的對象。只是他們躲在一個一時被人忽視的角落,靠著陰暗潮濕的土壤中的一點(diǎn)營養(yǎng),茍且活著。隨著搜索引擎的進(jìn)步,簡單制造重復(fù)內(nèi)容的站正在被剿殺。
這個時候,“偽原創(chuàng)”可謂是“應(yīng)運(yùn)而生”。眾多中小站長在做著類似的一件事:瘋狂地抓東西,再把抓來的東西改頭換面發(fā)布在自己網(wǎng)站上。如果一個站只有這些內(nèi)容,那這只是赤祼剽竊的防搜索引擎“剿殺”版,同樣是沒有存在價值的。并且這種偽原創(chuàng)就如同有了抗藥性的病菌一樣,對互聯(lián)網(wǎng)危害更大。請廣大中小站長不要怪筆者說得過分。筆者坦言自己也干過類似事情,但價值觀不能因?yàn)橐恍o奈而改變,不好的就是不好的。
讓我們的思維跳躍一下,觀察一下谷歌。谷歌(http://www.google.cn)是更大的信息抓取者,但它從來沒有讓人覺得“垃圾”。這是因?yàn)楣雀璋缪萘诵畔⒌慕M織者。谷歌對互聯(lián)網(wǎng)信息進(jìn)行分析索引,讓用戶更方便更快捷地找到自己所需信息,這就是谷歌的價值所在。谷歌成功地改變了人們的上網(wǎng)體驗(yàn),自身也成為了互聯(lián)網(wǎng)頭號公司。 我們再來看一看金山詞霸在詞典(http://www.iciba.com)。這個詞典里,除了傳統(tǒng)的詞典釋義,還加了網(wǎng)絡(luò)例句、網(wǎng)絡(luò)釋義等。后兩者的內(nèi)容是什么呢?是來自互聯(lián)網(wǎng)的一些文字片斷,是“采集”來的東西。
“采集”這兩個字很有意思,“采”有拿來之意,更有選擇之意。有選擇性地抓取內(nèi)容,稱之為“采”。很多中小站長做到了這一點(diǎn),但卻把“集”字給忘到一邊了。“集”就是對采來信息的一種組織。像谷歌、金山詞霸那樣的,我們做不來,但我們一樣可以有所為,這就要各位站長動腦子思考了。大企業(yè)各方面實(shí)力不是中小站長所能比的,但只要你動腦思考,你一樣可以找到自身的價值所在,一樣可以做出真正有價值的網(wǎng)站來。
“集”的目的,顯然要從用戶角度出發(fā)。方便了用戶,就體現(xiàn)了網(wǎng)站的價值。
這方面,其實(shí)許多大網(wǎng)站已經(jīng)給了我們很好的提示。比如同樣是做mp3搜索,Google提供了一個很有意思的挑歌功能(http://www.google.cn/music/songscreener),在這個頁面,你可以通過選擇節(jié)奏強(qiáng)弱、聲調(diào)高低、單色豐富程度等來選擇歌曲。Google可能是借助自身強(qiáng)大的技術(shù)實(shí)力用程序自動分析mp3文件生成的這些數(shù)據(jù),但我們?nèi)绻泄Ψ驅(qū)Σ蓙淼膬?nèi)容做偽原創(chuàng),順手加幾個數(shù)據(jù)又有何難呢?
比如我們做一個Flash音樂站,也可以對每個FV做類似的評分,比如畫面惟美分,內(nèi)容搞笑分,深情感人分等等。即便沒有時間整理這些,也可以放出去讓用戶來打分。當(dāng)你有了這些為用戶著想的人性化功能時,就沒有人再說你是一個剽竊者了,因?yàn)槟阋呀?jīng)做到了“集”,你已經(jīng)通過自己的努力改善了用戶體驗(yàn),你已經(jīng)體現(xiàn)了自身價值。
類似地,也可以做小粒度的信息聚合。把某一領(lǐng)域的內(nèi)容按一系列熱門主題容聚合在一起,可以讓用戶不用到處搜索就能看到相當(dāng)全面的信息。比如考利小游戲這個網(wǎng)站,對每個小游戲都做了個相關(guān)推薦頁面,就像大的新聞?wù)纠锏南嚓P(guān)閱讀那樣,把更多相似的內(nèi)容聚合在一起列出,可以讓玩家過一把癮。
如果有一定的技術(shù)基礎(chǔ),還可以做摘要處理。自動摘要技術(shù)可以對一段文本做精簡的概括。我們常用的Word里就有自動生成摘要的功能。互聯(lián)網(wǎng)信息龐大,有些用戶也許只想一覽眾山,而非個個細(xì)讀,這時自動摘要就可以大顯身手了。具體做起來,可以每篇做摘要,也可以對相關(guān)內(nèi)容做拼合再做摘要,這就取決于用戶體驗(yàn)了。如果你是做小說閱讀,又沒時間一部一部地整理小說,那么可以嘗試摘要功能,可以給只在乎情節(jié)梗概的用戶一個快速閱讀版。
遺憾的是我還沒有發(fā)現(xiàn)什么開源的自動摘要程序。好像DedeCMS(http://www.dedecms.com)里做了這個功能,筆者還沒試過。對于有技術(shù)能力的站長來說,做好的功能有時用著也未必方便。
Google、百度是“采集”的“集大成者”,我們集不了大成,也可以集小成。只要用心研究用戶體驗(yàn),再結(jié)合一些工具、技術(shù),為用戶打造一些貼心功能,讓用戶記住你,還是不難的,關(guān)鍵是要用心。“采”無過,“采”而不“集”,就不是好站長了。筆者拙文不過拋磚引玉,相信各位站長會有自己的“集”法。祝大家都能“集”小成,而后積為大成!
本文由http://www.kaoly.com站長供稿!
相關(guān)文章
網(wǎng)站收錄很低 為什么百度不采集你的網(wǎng)站?
你的網(wǎng)站為什么百度不采集呢?其實(shí)原因很多,網(wǎng)站內(nèi)容重復(fù)太多,seo過度、改版等等,對于這種現(xiàn)象我們該怎么應(yīng)對呢?現(xiàn)在說說百度不采集你的網(wǎng)站的原因和解決辦法,需要的2014-12-30- 目前站長圈內(nèi),比較流行的采集工具有很多,但是總結(jié)起來,比較出名的免費(fèi)的就這么幾個,這里簡單給大家介紹下, 方便需要的朋友2014-11-01
防止網(wǎng)頁被搜索引擎爬蟲和網(wǎng)頁采集器收錄的方法匯總
最常規(guī)的防止網(wǎng)頁被搜索引擎收錄的方法是使用robots.txt,但是這樣做的弊端是要將所有已知的搜索引的爬蟲信息都羅列進(jìn)去,難免有疏漏。2010-07-16- Google 用戶數(shù)據(jù)采集大揭秘.2009-11-20
建站經(jīng)驗(yàn) 你的網(wǎng)站該如何應(yīng)對被采集
雖然采集站的SEO比較難。但踏實(shí)的寫文章,在國內(nèi)這種氛圍下,很少會有人去做。2009-07-18- 現(xiàn)在很多網(wǎng)站都有抄襲和采集的行為,有了采集工具和目標(biāo)網(wǎng)站以后內(nèi)容再也不是什么頭疼的事。倒是如何提高采集內(nèi)容的排名成為了站長們最為頭疼的問題,如何提高采集內(nèi)容的排2009-05-26
- 業(yè)余站長成功率真的很低很低,如果哪個業(yè)余站長在三年之內(nèi)僥幸成功了,可以告訴我。不要把數(shù)萬IP的垃圾站發(fā)我就行了。如果垃圾站有數(shù)萬IP是不足不奇的,你的網(wǎng)站能在三年后2009-04-02
- 聽人說,百度最近封殺了采集的網(wǎng)站,難到采集文章的網(wǎng)站一定沒有出路嗎? 個人覺得未必。 QQ空間 站是本人的網(wǎng)站。里面的內(nèi)容全是采集來的。記得第一次百度兩個星期左2008-12-31
- 我是一個習(xí)慣在互聯(lián)網(wǎng)上閱讀的人,遇到上好的文章就另存到我的電腦上,久之電腦的資料就顯得很零亂,當(dāng)時就想建立一個數(shù)據(jù)庫,把這些文章保存起來,就這樣開始了我的站長的2008-11-04
- 很多站長都在為自己的站發(fā)愁。為什么我的站流量那么低?為什么我的站收入那么少?原因很明顯,你建立的是垃圾站。 那么什么是垃圾站呢?網(wǎng)上關(guān)于垃圾站的定義和判斷標(biāo)準(zhǔn)2008-11-03