微觀視角看待搜索引擎優化細節

發布時間:2010-07-18 發布者: 點擊:

首頁>建站常識

注意:我不是SEO從業者亦不是搜索引擎排名工程師,我盡量保證提到策略有效且合乎規則的,如有謬誤,請略過或指正,我本人不推薦一些所謂的“黑帽”策略,因為能欺騙搜索引擎一時卻不能長久,所以做垃圾站的或者想賺快錢的也可以忽略本文,本文的目標是希望和大家一起探討如何創建一個既對用戶又對搜索引擎友好的網站。

  搜索引擎優化最值得參考的兩篇文檔:Google Search Engine Optimization Starter Guide 和 百度搜索引擎優化指南,這是兩份官方文檔,非常值得仔細研讀,網上其他文檔充斥太多訛傳和猜想(包括本文,雖然我極力想避免)。

  一直覺得搜索引擎優化是一個符合馬太效應的過程,需要慢慢的積累,表現好的網站越來越好,所以如果已經有一個好的網站盡量持久的運營,如果要換域名的話,原有的鏈接最好做301跳轉到新域名的對應鏈接,這是搜索引擎推薦的做法,大家可以看看最近javaeye切換域名到iteye,基本的鏈接都做了301跳轉,對用戶來說也非常友好,robbin同學是個SEO高手,后面還會再提到他的另一個高明之處。

  一、鏈接篇

  傳聞hao123站長李興平曾說過“SEO沒有什么技術,就是靠外鏈”,可見外鏈對SEO來說有多么重要的,我們把被鏈接的頁面叫做子頁面,鏈接到子頁面的頁面叫父頁面,按照Google Pagerank的算法,子頁面的父頁面越多,子頁面的權威性越高;子頁面的父頁面權威性越高,子頁面的權威性也越高,有個域名是“www.miibeian.gov.cn”的網站,由于基本上全中國網站都鏈接到他了,不管網站做的怎么樣,Google PR穩穩的為10。(不要試圖訪問這個網站,已廢棄了,暴殄天物啊)

  除了外鏈,站內鏈接也是一個非常重要的部分,作用雖沒有外鏈那么作用大,勝在可以自己控制,添加一些相關鏈接,除了能夠給其他頁面提升權威性外,也能很好的提高用戶粘性,降低跳出率。

  鏈接里面有一個很重要的部分就是“錨文本”,什么是錨文本呢,比如這個鏈接 當知網 ,當知網三個字就是錨文本,錨文本對搜索引擎來說非常有用,因為搜索引擎很難獲得某個頁面的關鍵字,標題獲取是最主要的來源,錨文本也是一個非常重要的因素,可以很簡要的描述頁面內容。

  這里有個小故事,很多美國人對小布什不滿意,于是有人發起了個倡議,在自己的博客上建立一個鏈接,鏈接的錨文本是”Loser”,鏈接的地址是小布什在白宮的頁面,于是很多人用google搜索”Loser”,小布什的白宮頁面穩穩的排在第一位,雖然小布什的白宮頁面上沒有”Loser”這個關鍵字,架不住從”Loser”跳過來的鏈接太多,也就壯烈了。(Google現在已經改進了算法,避免錨文本被人濫用)

  網站添加鏈接時,盡量避免鏈接到作弊網站,因為”蛇鼠一窩”,搜索引擎很容易把鏈接到作弊網站的網站也當作作弊網站;需要特別注意的是開放了博客空間、留言板、BBS之類網站,很多spammer用灌水機貼了很多垃圾網址,要注意即時清除,否則容易被誤傷,如果業務需求不能隨便刪除的話,可以參考現在微博的做法,提供一個短地址或者地址跳轉服務,最不濟的話,加上nofollow標記。

  “鏈接堆砌”也不是一種好的做法,一段文字里面密集的鏈接到目標網站,現在的搜索引擎已經很容易識別了。

  雖然之前百度的“左螺旋哥”風光無限,但”linkfarm”也不是一種好的做法,搜索引擎已經能夠識別,作弊的方法雖然能短時間獲得排名,一旦被K,基本萬劫不復。

  對于鏈接這種事情,建議還是一五一十的慢慢做,當然,有資源的寫一些軟文投遞到一些優質的網站發表也大有裨益。

  二、標題篇

  頁面標題是我認為SEO所有因素中的最重要的那個,一個好的標題應該應該包含關鍵字,比如本文的標題包含”搜索引擎優化”、”SEO”這兩個關鍵字,標題不宜過長,忌關鍵詞堆砌,標題太長的話,對于每個關鍵字的權重就降低了,另外,對于搜索引擎來說,頁面標題的長度也是有限制的,太長的標題直接容易被切掉,大家可以看一下這個例子,這不是一個好的標題,重要的關鍵字放最后還被截掉了。

  個人覺得一個好的標題設計可以參考這種格式:標題_頻道名稱_網站名稱,好的標題”短小精悍”,切實把握用戶心理需求,很久以來,我的一篇關于MySQL 分頁的文章一直排在Google的第一位

  頁面的meta信息,包括description和keywords,對排序作用不大,對生成內容摘要有用,所以如果可以的話還是添加上去,免得搜索引擎把不重要的文字當作摘要,影響用戶點擊。

  三、URL篇

  url目錄不要太深,/a/b/chttp://image.zzqifan.cn/d/e/f.html這樣的鏈接權重會有一些影響,另外迷宮型的url有可能會被認為是作弊/a/b/chttp://image.zzqifan.cn/d/a/b/chttp://image.zzqifan.cn/d/e.html

  url設計盡可能精簡,盡量不包含一些不能被系統自動識別為url的字符,方便用戶轉帖

  盡可能的使用靜態URL,雖然說搜索引擎已經能索引動態url,不管對用戶還是搜索引擎來說,靜態的url更好一點

  同一篇內容,只有一個url,盡量避免無效的參數,有些網站為了統計的需要添加類似foobar.html?ref=xxx這樣的參數著實不好,流傳出去,一個頁面多個地址

  不同類型的內容url應該有區別,比如列表頁/list/9527,內容頁/view/3306

  關于目錄和子域名的選擇,子域名的權重會比目錄高一些,注意平衡,一般內容較少時用目錄,忌濫用子域名,子域名越多,不太容易積累每個域名的權重,還不如重點維護好幾個關鍵子域名

  好的內容和差的內容一定要從子域名或子目錄區分開,百度百科和百度貼吧兩者的權重差別就很大,好的內容和差的內容(比如UGC的內容)混在一起,容易被誤傷

  url中包含英文關鍵字,對google來說甚佳,baidu來說不太清楚,url中多個關鍵字建議以”-”隔開,沒有太多的證據證明中文關鍵字做urlencode對seo有效,不過中文拼音縮寫對用戶來說可能會更友好一點

  對于時效性比較強的內容,可以用日期作為目錄,現在的搜索引擎已經可以獲取頁面內容的時間

  好的url設計應該能夠會意,這篇URL設計準則值得讀一下

  四、內容篇

  原創的內容更受搜索引擎青睞,搜索引擎對采集的內容也有一定的容忍度,一個好的網站最好不要大量采集,免得自己的優質內容被誤傷,搜索引擎判斷是否原創內容的方法有很多,比如頁面生成時間、來源鏈接等等,不過很悲劇的是國內很多網站轉帖不帶來源地址,如果轉帖網站的權重比原網站高的話,首先被搜索引擎索引到,很容易排在前面,所以我們經常會看到一些聚合類的網站搜索結果靠前

  內容的閱讀體驗也非常重要,包括網站的打開速度、頁面停留時間、跳出率等等,這些指標有的是從各個搜索引擎提供的統計系統中獲得,有的是通過用戶行為獲取,比如頁面停留時間,在搜索結果頁中點第一個鏈接和第二個鏈接之間間隔,很有可能就被當作是第一頁面停留的時間,當然這個有些不準,因為很多人喜歡打開多個,不過搜索引擎應該有辦法來區分

  頁面的內容應該要和標題呼應,應用好

  ……

  之類的標簽突出你的標題和核心內容,html標簽很多是有語義的,如果可以的話,建議按照規范使用

  專題性的內容是搜索引擎的最愛,在搜索一些技術關鍵字的時候,很容跳到javaeye的關鍵字內容聚合頁,這也是robbin高明之處

  內容頁面設計盡可能的清晰,方便搜索引擎索引需要的內容,如果搜索引擎給頁面生成段落或者目錄信息,恭喜你,說明你的網站權重已經不錯了。

  內容結構盡量扁平,可以按照這種結構規劃:首頁、列表頁、內容頁

  盡量避免用JS/Flash/iframe之類的來展示主體內容,目前只有google宣稱能夠解析js內容,baidu明確表示不會解析js內容,iframe是被所有搜索引擎拋棄的

  五、工具篇

  Google網站管理員工具是我認為最好的SEO工具,方便查看網站的搜索引擎表現狀況

  站長之家的站長工具也是一個非常不錯的輔助工具,方便查看pr、外鏈之類的屬性

  百度指數、百度火爆地帶、Google Adwords關鍵字工具對于優化關鍵字來說很有參考意義

  善用robots.txt和sitemap對于優化網站搜索引擎表現也大有裨益

  后記:

  搜索引擎優化是一個漫長的過程,涉及的因素很多,同樣的木桶原理在這里也適合,本文的內容大多來自google和百度那兩篇官方指導文檔,大多經過實踐驗證,歡迎交流fuchaoqun#gmail.com (#換成什么,你懂的),可以交換一些網站推廣方面的資源。歡迎轉載:www.567msc.com