URL標準化(確定首選域)
為什么要確定首選域 ? 什么是確定首選域 ?
為什么要URL標準化 ? 什么是URL標準化 ?
一般情況下,帶www和不帶www的是指向同一個網站,搜索引擎也是這么認為的
如:
edge-cloud.cn
www.lohen.cn
一個網站至少有2個url指向同一個首頁
比如:
http://www.lohen.cn/
http://edge-cloud.cn
http://www.lohen.cn/index.php
點擊這幾個鏈接,都可以訪問
北京網站建設公司鋒云科技的首頁
在用戶看來好像是一樣的,但是在搜索引擎看來卻不一樣,在搜索引擎收錄和展示穩定下來后,它會選擇其中一個作為首選域來展示。搜索引擎去判斷去確定的過程就叫首選域的確定;所以首選域就是搜索引擎認為你網站的主域名是哪一個,是帶www的,還是不帶www的。它會確定網站的首頁,哪一個url是主要的域名,將來在排名的時候就用主要的域名來做排名,讓搜索引擎自己判斷選擇是需要時間的,而且它們的選擇可能不盡人意。
如果不告訴搜索引擎網站首頁主要的url是哪一個的話,搜索引擎就會花很大功夫自己去判斷,搜索引擎在糾結的過程中會導致權重的流失。為了讓網站的權重更高一些,自己要懂得首選域的概念以及首選域的確定方式,自己把它確定好,搜索引擎再來判斷的時候,這個過程就不會有任何權重的流失,這就起到了集中權重的作用,網站首頁應該獲得的權重就不會流失,同樣的,網站的某一個內頁也存在多個不同的url能同時訪問到(如動態的url和靜態url),這些url在搜索引擎看來是不同的,所以要選擇確定其中的一個url用來集中權重,用來排名,而放棄其它的url ,這樣的過程叫URL標準化
URL標準化的目的是,把所有權重(外鏈內鏈)都集中到一個URL上,而不是讓它分散到多個URL上;對網站各個頁面的URL進行標準化,保證每個頁面都留一個URL與之對應
URL標準化操作
請記住:每個關鍵詞應該對應的是一個URL而不是多個。(但可以多個關鍵詞對應同一個URL)
1、301跳轉
對于首頁,一般選擇帶www的域名作為唯一URL(首頁的URL,搜索引擎稱為首選域)
域名解析的時候,應該是帶www和不帶www的都解析到網站首頁,在條件許可的情況下,采用301的方式把不帶www的,轉向到帶www的域名;
如果不熟悉301的辦法,則將所有URL都帶上www,用這樣的絕對地址也可以
2、標準的URL格式
首選域和標準的url ,前面的http都要帶
建議給首頁做站內站外鏈接的時候url最后都帶個反斜杠
目錄結構的url一定要帶上反斜杠,列表頁采用目錄結構的url
內容頁(如xxxxxxx.html)不帶反斜杠
問題出來了
搜索引擎認為帶反斜杠和不帶反斜杠的兩個不同的url
在搜索引擎看來,帶反斜杠和不帶反斜杠,默認是一樣的。但為了效果最佳,請注意每次加鏈接時,都加上反斜杠。
3、首頁url后面不要再有index.html 、index.php等
否則,搜索引擎會把權重傳遞給帶index.html的頁面,而實際希望排名的是不帶index.html的頁面,交換友鏈的時候一般不帶index.html ,這種情況就導致了權重的很多分散
假如網站每個欄目頁面的URL格式是這樣的,如:
http://www.lohen.cn/seo/index.html這是程序自動的,我是否有必要把每個index.html去掉?
咱們URL標準化的宗旨在于,對權重進行集中,而不讓其分散。所以,如果是帶index.html的URL,你各個地方都用這個URL即可。可以不用去掉。
當一個網頁有數個URL可以同時訪問時,確定唯一的URL是一個重要的技巧。這一點,絕大部分新手是不清楚的。所以你能看到很多網站上首頁的鏈接,指向的是帶index.html的。
除了首頁,其他的一起考慮下
一級目錄時,一般直接用目錄形式,而不帶index.php等
http://www.lohen.cn/bbs/
http://www.lohen.cn/bbs/index.php
一樣的頁面,一樣的關鍵詞。我們選擇了
http://www.lohen.cn/bbs 作為唯一的URL。
或許有人認為:
采用目錄結構的URL,如www.lohen.cn/seo 比 www.lohen.cn/seo/index.html 結構的URL要好點。
現在,我們認為這樣的差別很小,即:采用以上兩個方式對排名影響很少,看你哪一個比較方便。
4、靜態url
希望排名的是靜態化之后的url ,怎么做才能夠讓搜索引擎知道我們以靜態url為主
①網站上所有的鏈接,動態的改成靜態的(或偽靜態)
如果做了sitemap ,這里面的鏈接也要改一下
②網站靜態鏈接陸續收錄了很多之后,靜態收錄一半之后,用lobos.txt把動態鏈接批量屏蔽掉,這樣就開始真正地告訴搜索引擎,讓它只收錄網站上的靜態鏈接,不要再收錄動態的鏈接,接下來發內鏈外鏈也用靜態鏈接
動態鏈接和靜態鏈接之間不要再301 ,實際存在的鏈接是動態鏈接,靜態鏈接是偽靜態,它已經跳轉到動態鏈接上了,再301的話,就成了來回跳
5、采用絕對地址
網站首頁和各個頁面采用絕對地址
在網站首頁點擊右鍵查看源代碼,或者打開網站的后臺源代碼:
查找指向網站首頁的鏈接,一般情況下是如下兩種情況:
<a href="/">首頁</a>
<a href="
http://www.lohen.cn/">
網站建設</a>
前者是相對地址,后者是絕對地址。
當我們要把首頁鏈接的相對地址修改為絕對地址時,所作的操作即是,把<a href="/">修改為<a >
同理,其他的鏈接修改:
把<a href="/bbs/">修改為<a href="
http://www.lohen.cn/bbs/">;
把<a href="/edu/">修改為<a >;
把<a href="/wangzhanjianshe-7-2.html">修改為<a href="http://www.lohen.cn/wangzhanjianshe-7-2.html">
很多時候,源代碼里看不到類似這樣的href="/1_13.html" 的代碼,而是一個用來調出這個代碼的函數。你可以:
1、直接在那個函數前面加 http://www.lohen.cn/
2、或者,刪除函數,而直接把絕對地址寫上。(這樣的后果是,內容變化時,需要手工修改)
舉例說明:
例如原來是:
<a href="{formaturl type="article" siteurl=$siteurl name="contact"}">聯系我們</a>;
你可以通過2個方式試試:
①<a href="{formaturl type="article" siteurl=http://www.17qiti.com/$siteurl name="contact"}">聯系我們</a>;
②<a href="{formaturl type="article" siteurl=http://www.17qiti.com/xxx.html name="contact"}">聯系我們</a>;
其中,xxx.html 是聯系我們頁面的URL地址。
很多時候,沒有辦法所有鏈接都采用絕對地址,但只要主要的導航和欄目,頁眉頁腳那邊采用絕對地址即可。其他可以靈活處理
相關疑問
1、采用絕對地址有什么好處呢?和SEO有什么關系?
解答:
①如果網站都采用相對地址,那么當不同的域名同時解析一個網站時,訪問這多個域名,將內容一樣。這讓搜索引擎分辨不出到底哪一個是主站。
②如果沒有采用絕對地址,可能導致競爭對手惡意鏡像你的網站,或搜索引擎誤收錄虛擬主機提供的二三級域名而不收錄主域名。(這種事情時有發生)
③首頁采用絕對地址,還可以解決首選域的問題。而無需進行復雜的301操作。
如果你的網站都采用帶www的絕對地址,這樣可以把網站所有權重集中到帶www的主域名上。有助于主域名權重的提升。
2、是否一定要這樣做?
新的網站,盡可能這樣做。避免未來可能發生的各種問題。
如果有些困難,只要首頁部分鏈接采用絕對地址即可,不一定要所有的都采用絕對地址。
比如:采用論壇程序的網站,只要右下角的頁腳采用絕對地址即可。碰到一些比較麻煩的修改,不用所有的都修改,只要修改能修改的部分即可。
3、如何簡單通俗理解相對地址和絕對地址。
比如:我問你,你現在在哪一個城市?你如果在深圳,回答應該是:深圳。
如果一個俄羅斯人問你,你現在在哪里?你應該回答,中國深圳。
前面那個是相對地址,因為我和你都在中國,就省略了。
后面那個是絕對地址,說中國深圳,所有的地球人都知道你在哪里。
4、是否有更簡易的辦法來解決這個問題?
我們發現了一個好用的標簽,可以非常好解決首頁采用絕對地址的問題。
叫做基準標簽
試驗測試一個有用的meta標簽
標簽名:<base href="http://www.你的域名.com/"/> 請注意帶上 http://
功能:基準標簽。
實驗結果:本標簽可以使用。
采用修改代碼的方式,需要不少工作,同時一些同學修改時也會碰到困難?,F在引入該標簽,如果測試成功,將非常簡單解決這個問題。
使用該標簽后,只要在網頁上,添加這個標簽,就可以默認全部鏈接都采用了絕對地址。
添加的位置。在頁面源代碼里的meta標簽位置,添加一行代碼:
<base href="http://www.你的域名.com/"/>
要試驗和測試的工作:
首先,在自己網站采用這個標簽,然后使用沒用的,沒收錄的域名,解析到那個的網站。最后,向百度和Google提交這個沒用的域名。
比如:你拿一個沒用的,沒收錄的域名,解析到
http://www.lohen.cn/的ip上,我這邊通過下,讓你的域名可以訪問seowhy的首頁。
假設seowhy用了基準標簽,你的域名應該不被收錄或只收錄首頁。
那說明,這個基準標簽,可以起到保護你網站防止被鏡像
之后的10-20天,觀察這幾個沒用的域名,是否被收錄。
得到的結果是:只收錄首頁,或都沒收錄。
以上結果成立,說明搜索引擎也識別該標簽,這個標簽可以推廣使用,節省時間,同時帶來很多方便。
這個標簽還有一個有用的功能。比如,希望網站每個頁面都在新窗口打開,可以添加這么個標簽即可。如:
<base href="http://www.你的yuming.com/" target="_blank" />
5、不管什么時候都用心目中的那個url
你希望哪一個URL能有排名,那么在做站內和站外錨文本時,就只用這個URL,而不用其它的。不然權重不能集中到你希望有排名的那個URL上。如果一會兒用這個,一會兒用那個。你雖然給你的網站首頁做了100個錨文本,但是,有的時候用帶www的來做外鏈,有的時候用不帶www的來做外鏈,有的時候又用帶index的首頁來做外鏈,雖然看起來好像做了100個外鏈,但起作用的可能不到30%
剛開始的幾個月,site:不帶www的域名,可能存在帶www和不帶www混合的結果。當穩定下來后,就只剩下首選域了。
如果搜索引擎自動選擇了帶www域名作為首選域,那么在site和排名時,網站的URL就會是都帶www的。
一個小常識:
往往發現,site不帶www的域名,展示結果比site帶www的域名,結果會多一些。
這是自然的,因為前者包含了后者,而后者不包含前者。
如果發現相反的情況,那是搜索引擎的錯誤。
Google在2010年3月增加了一個新的標簽,有助于我們更好確定首選域。但請注意這個標簽目前僅Google認可。
這個標簽是:rel="canonical"
我們在網站首頁的head標簽內,添加這么一行:
<link rel="canonical" />
這樣就確定了 http://www.example.com/ 為網站的首選域,在以后Google的搜索結果里就不會有不帶www的http://example.com/了。
如果你剛用上這個標簽,則需要半個月至一個月才能更新過來。