一、網站架構
1、二級域名的使用
因為業務的地域性擴張或者內容的分割,對于大型網站來說,二級域名的使用是不可避免的。2006年我們做第一個分站時也分別討論了兩種方案,一種是先按業務劃分,再按地域劃分,如:http://wuxi.sell.housexxx.com ;另一種是先按地域劃分,再按業務劃分,如:http://sell.wx.housexxx.com ,這兩種分法都都先例前一種是新浪房產在用,后一種是搜房在用。后來考慮到分站以后的業務擴展的差異性,使用了第二種方案。對于在各分站開展的各項業務也就順理成章的變成三級域名。
網:http://www.wfuwu.com/
眾所周知,二級域名或者三級域名對于搜索引擎來說就是一個獨立的網站。對于大型網站開通眾多二級域名有什么好處呢。呵呵,好處是擺在明處的,鏈接啊,你有100個二級域名就相當于100個網站,相互的交叉鏈接,了不得啊。另外一個好處不能明說,就是可以開一些二級域名出來做測試域名,就算被K了也不會影響到主站。沒有自己DNS服務器的小站長也不要遺憾,只要有自己服務器,加一個DNS服務是很簡單的。使用虛擬主機的朋友,只能說抱歉了,國內包括很多大的域名注冊商(比如萬網)的二級域名解析都很慢,不用說其他的這些了。
2、多服務器架構下對搜索引擎的影響
對于大型網站來說,使用負載均衡技術相當普遍,常見的是基于LVS的Linux負載均衡技術,部分網站也可能是使用F5這樣的專用設備。對于使用反向代理的網站,從外部訪問就是一個IP,就不存在什么問題了。如果是采用雙機熱備方式的網站,一旦主服務器宕機,負載就自動切換到從服務器上,這樣服務器的IP會變化,更尷尬的是有一段時間,我們的數據同步沒做好,百度快照總是不對勁,我還以為是百度數據倒回,結果是我們自己數據倒回,真是汗啊。所以服務器的穩定對搜索引擎優化來說是一件很重要的事情。
3、目錄的部署
大家都知道,目錄的權重高于頁面,那么用Rewrite把網站做全站偽靜態就成了一個必然的選擇。配置Rewrite很簡單,只要在httpd.conf里面加上Mod_rewrite模塊,然后寫上你的規則就可以了,如果是Apache服務器通常是去掉前面的注釋,具體操作網上有非常多的教程,就不贅述了。如果是虛擬主機用戶,可以在網站根目錄下加上.htaccess文件,文件里面寫上你的規則,國外主機基本上都是支持Rewrite的,國內支持Rewrite的虛擬主機也越來越多了。
做完上面這些后,網站就變成全是目錄這樣的形式了,是不是挺清爽的。別急,下面是關鍵。當你做完這一切,你會發現,搜索引擎并不收錄你修改過的頁面,應該說Google還是逐步的更新鏈接的,而百度是很少更新的。用site命令看一下收錄的頁面,還是令人沮喪的.html文件,更糟糕的是還有一些動態文件。原因很簡單,我們只是更改了頁面的鏈接,而頁面的內容和原來完全一樣,并且原來的內容依然可以訪問到,搜索引擎不會收錄兩張完全相同的頁面,相似度100%的頁面。因此網站的結構上線前就應該規劃好,就省去了以后的很多麻煩,我個人的習慣是在網站上線前用Robots.txt把所有的搜索引擎都屏掉。如果發生了這種情況該怎么辦?做一次全新的改版嗎,大可不必那么費事,在文件頭部加上301跳轉就可以了。
具體代碼:
if(strpos($_SERVER['REQUEST_URI'],”list.php”)!==false){ $id = intval($_GET["id"]);
Header(”HTTP/1.1 301 Moved Permanently”);
Header(”Location: http://newhouse.housexxx.com/list-”.$id.”/“); unset($id); }
上一篇 淺談網頁UI之Logo篇