如果沒有經過適當的處理和優化,WordPress博客中將有很多內容重復的頁面,而這些重復內容會不利于搜索引擎的索引。本文整理和歸納了關于“重復收錄“的一些資料和好的建議,將全面分析“解決博客內容被重復收錄“的途徑:
1. WordPress博客中有哪些“重復內容“
(a) 首頁顯示的文章與獨立文章頁面的重復(特別是首頁輸出全文的blog)
(b) 分類頁面和獨立文章頁面的重復:在WP博客中,可以通過分類頁和存檔頁來訪問一篇文章,因此你的某篇文章會有不止一個url(如下), 從而造成重復收錄。
www.yoursite.com/2008/01/post-name
www.yoursite.com/category/wordpress
http://www.veryhuo.com
(c) 對于很多博客,www.yoursite.com和 yoursite.com都可以訪問,而沒有做跳轉,你訪問這兩個地址將得到同樣的結果,相當于整個站的重復。
(d) 在google眼中,www.example.com/page 和 www.example.com/page/是不同.
(e) 文章內容和feed內容的重復,比如:
www.yoursite.com/2008/01/post-name
www.yoursite.com/2008/01/post-name/feed。
如何避免博客內容的重復收錄:
(1)設置你的All in One SEO插件。
(2)在服務器上添加robots.txt文件。
這是別人的方法。我沒有采用。我是在谷歌網站管理員工具里設置,讓谷歌蜘蛛不抓取我網站的重復內容。在管理員工具設置里,忽略某些內容的抓取。最重要的是tag標簽,它是wordpress博客中最重要的重復源。
你還可以添加自定義參數。這些自定義參數從哪來呢?site你的域名,把那些與你的博客的固定鏈接,不同的目錄復制粘貼過去就可以了。就像下圖中的,我的固定鏈接是域名加數字加html形式。那些域名后面帶的拼音標簽一律都是要k的對象。