
一個規範的網站◕✘│☁,網站地圖肯定是少不了的✘↟。一個單獨的網站地圖頁面不僅可以讓使用者對整個網站的目錄結構及內容有一個很好的認識且一目瞭然◕✘│☁,而且方便百度蜘蛛跟蹤連線爬行到網站所有主要部分內容✘↟。
網站地圖主要有兩種✘↟╃:
HTML網站地圖
下面我們一個個來學習這兩種網站地圖✘↟。
HTML網站地圖
HTML版本的網站地圖主要是給使用者看的◕✘│☁,主要列出了網站上所有主要連線的頁面✘↟。特指HTML版本網站地圖英文是sitemap◕✘│☁,其中s需要小寫✘↟。
小規模網站◕✘│☁,其網站地圖可以列出網站上所有的頁面✘↟。
規模稍大的網站◕✘│☁,一個網站地圖列出所有頁面不是很現實✘↟。可以只列出網站上主要連線(一級分類◕✘│☁,二級分類)✘↟。也可以將網站地圖分成多個檔案◕✘│☁,主網站地圖列出通往次級網站地圖的連線◕✘│☁,次級網站地圖在列出一部分頁面連線✘↟。這樣◕✘│☁,多個網站地圖頁面加一起◕✘│☁,就可以列出所有或絕大部分重要頁面了✘↟。
如果有一個良好的導航系統或者連結結構的網站◕✘│☁,不一定要列出完整所有頁面的網站地圖✘↟。其實◕✘│☁,網站地圖和分類結構大同小異✘↟。
XML版本網站地圖主要是給搜尋引擎看的◕✘│☁,由XML標籤組成◕✘│☁,該檔案必須是utf8編碼✘↟。實際上◕✘│☁,就是列出網站要被收錄的頁面連結✘↟。特指XML版本網站地圖英文是Sitemap◕✘│☁,其中s通常是大寫✘↟。
簡單的可以是一個文字檔案◕✘│☁,列出頁面的連結◕✘│☁,一行一個◕✘│☁,這樣搜尋引擎就能理解和抓取檔案的內容了✘↟。
標準的檔案如下✘↟╃:
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<url>
<loc>http://wxlpsy.com/category-2.html</loc>
<lastmod>2016-11-07</lastmod>
<changefreq>weekly</changefreq>
<priority>0.4</priority>
</url>
</urlset>
標籤解讀
urlset✘↟╃:宣告檔案所使用的Sitemap協議版本◕✘│☁,是必須要的標籤
url✘↟╃:是它下面所有網址的母標籤◕✘│☁,是必須要的標籤
loc✘↟╃:列出頁面完整的url◕✘│☁,是必須要的標籤
lastmod✘↟╃:表示頁面最後一次更新時間◕✘│☁,此標籤可選✘↟。
priority✘↟╃:可選標籤◕✘│☁,表示連結的相對重要程度
changefreq✘↟╃:代表檔案的更新頻率◕✘│☁,是可選標籤✘↟。可以有以下值✘↟╃:
changefreq標籤值
always✘↟╃:表示一直變動◕✘│☁,指每次訪問頁面內容都不同
hourly✘↟╃:每小時
daily✘↟╃:每天
weekly✘↟╃:每週
monthly✘↟╃:每月
yearly✘↟╃:每年
never✘↟╃:從不改變
設定頻率更新值是給搜尋引擎一個參考✘↟。但是◕✘│☁,搜尋引擎不一定就認為更新頻率就如站長設定的一樣✘↟。
最多可以列出5w個URL◕✘│☁,且檔案大小不能超過10MB✘↟。
如果網站要收錄的URL太多◕✘│☁,可以分成多個網站地圖檔案✘↟。
一個網站最多可以有1000個檔案◕✘│☁,可以列出5000w個網址✘↟。
可以透過站長工具後臺提交◕✘│☁,百度▩·↟◕、360▩·↟◕、google都支援該功能✘↟。另一種可以放到robots.txt 檔案了通知搜尋引擎◕✘│☁,如下✘↟╃:
Sitemap: http://www.manuelalendoyro.com/sitemap.xml
主流的搜尋引擎都支援robots檔案制定網站地圖檔案位置✘↟。