做網站的王道就是內容和外鏈,而相比起外鏈的構建,網站內容的添加有時更讓站長們頭痛。原創內容大家都知道是好東西,就是不容易弄到,自己寫的話會耗費大量的時間,也不一定寫得好。而一味采集和重復別人的內容的話,就會變成搜索引擎所討厭的垃圾站。偽原創就是介乎于兩者之間應運而生的。所謂的偽原創,簡單來說就是欺騙搜索引擎,讓它以為你轉載的內容就是原創內容。
偽原創的方法一般是在原作者的文章上修改標題,替換同義詞,增加或刪減一些語句,重寫首段和尾段,修改段落的次序等來達到區分原來文章的目的。很多人認為,只要經過以上這些步驟的修改,文章就成為獨一無二了,搜索引擎也認不出那是別人的文章,偽原創也就能成功過渡成原創。但我不禁要問了,這是不是我們的一廂情愿啊?搜索引擎真的認不出嗎?它又是怎樣判斷文章是轉載還是原創呢?
其實我們可以用一個簡單的模型來解析搜索引擎如何判斷內容是否轉載。搜索引擎會把收錄在數據庫兩個相近內容A和B各分成N塊獨立的區域,并對其一一比較,當這些區域相同部分的數目超過了搜索引擎所設定的閥值M時,搜索引擎就會認為A和B是互為轉載的內容。這里把內容分成N塊區域,就是指搜索引擎的分詞技術,而判斷重復區域是否超過閥值M,就是指搜索引擎的索引技術。當然,N和M的值是搜索引擎自己的算法設定的,不同的搜索引擎也不同,我們更是無法知道,不過我們可以從上面的模型窺探出很多有用的東西。
首先,N值和M值決定了搜索引擎判斷轉載內容的能力。當N值越大,M值越小時,搜索引擎辨別轉載內容的能力就越高;反之,就越低。而這兩個值是由算法間的協調,算法所消耗的資源等多方面決定的,所以搜索引擎不會一味追求高的辨別能力。
其次,從模型中可以看出上面所提到的偽原創辦法對搜索引擎并奏效。搜索引擎是通過分區來判斷內容的重復性,跟內容的次序沒有關系,所以修改段落次序的方法是肯定行不通。而其他的幾種偽原創方法,包括增減、替換和重寫內容等,它們有效性一定程度上由N值和M值大小決定??紤]到搜索引擎發展至今,算法已經相當成熟,判斷內容重復的能力也相當有效,所以簡單的增加刪除內容或替換部分內容并不能讓搜索引擎當做原創。
簡單的來說,要讓搜索引擎認為我們的內容是原創內容,我們的內容就要有明顯的區別,就是大部分都得改。
本文由http://www.codetk.com站長原創,尊重作者的勞動和知識產權,轉載請保留此信息,謝謝!