“谷歌中文網站管理員博客”髮錶了一篇文章,介紹了《Google網站管理員工具》中推齣的新功能-“網站性能”。這個工
具是通過Google工具欄記录了用戶訪問你網站的速度,並給齣了很多加快你網站速度的建議。
而傳聞Google將會把網頁加載速度作為影響排名的一個因素,那麼網頁打開速度是不是能影響SEO效果?如果能影響,那是
怎麼影響的呢?
在揭示其中的道理之前,我希望大傢能把上麵那些傳聞或“網站性能”的功能都忘掉。讓我哦們追本溯源,來看看網頁打
開速度和SEO流量之間的關係。
做SEO有時候不需要聽從別人給你的信息和意見,你隻要專註於研究蒐索引擎,同樣也能成功的。這種關係的髮現,也得益
於重視數據分析,所以我在《怎麼樣學習SEO(二)》中把數據分析能力列為SEOer應該具備的四大能力之一。由於有很多
數據做支撐,現在我來給大傢分析其中的聯係,大傢就容易看懂很多了。
到了後期,連Google也認識到了網頁速度和SEO流量之間的關係,所以在這個“網站性能”以前就推齣過相關的工具來帮助
網站管理員。
要說明這種關係,就要從蒐索引擎爬蟲說起。不知道大傢對於蒐索引擎爬蟲在一個網站上的行為有沒有概唸,我現在髮一
下某網站的一些數據齣來,大傢就能意識到一些爬蟲的特性了。下麵是從服務器LOG日誌份中分析齣的數據。
從上麵圖1中可以看到Google訪問這個網站206次,這206次裡麵是由很多個不同的爬蟲訪問的。圖2顯示:有的爬蟲一天之
內來了8次,一共停留了2小時左右,有的爬蟲來了1次,停留了20小時以上。所以這個網站是被很多爬蟲在不間斷的訪問著
,為了計算方便,可以把Google 所有的爬蟲停留在這個網站的總時間加起來。雖然一天隻有24小時,但是Google的爬蟲這
一天花在這個網站上的時間可能是成百上韆多個小時。這裡真實的數據是:在這個網站中,Google所有爬蟲那天在這個網
站上花費的實際總時間是721個小時。
而服務器log日誌裡同樣可以分析齣爬蟲在一個網頁上停留時間。如:
得到了這兩個數據以後,用所有爬蟲總的停留時間除以單個網頁的停留時間,就是蒐索引擎爬蟲這天所抓取的頁麵總量。
721小時×3600秒÷35秒=74160頁
那麼得到這個蒐索引擎爬蟲這天所在花去的頁麵總量有什麼用呢?
對於一般的小網站來說,一天能被抓取74160頁是一個很不錯的數據。但是我上麵給齣的是一個中型網站,它整個網站的頁
麵總量有800多萬有SEO價值的頁麵。那麼,在最理想的情況下,這些頁麵被蒐索引擎抓取完要花費的時間為:
800萬÷74160頁=108天
這是理論上最理想的情況,實際上真實的情況為:
由於有很多個爬蟲在抓取網站,有很多的頁麵在一天之內是會被爬蟲重複抓取的。有的頁麵一天之內被抓取20多次,有的
頁麵一天之內之被抓取1次。通過“停留總時間÷單個頁麵停留時間”得到的頁麵數量,是沒有去除那些重複抓取的頁麵的
。所以蒐索引擎一天之內實際抓取的不重複頁麵沒有74160頁那麼多,而是40000頁的樣子。還有一點,爬蟲今天抓取的頁
麵,到了明天還有很多會被重複抓取,所以爬蟲不光在同一天內會重複抓取很多頁麵,而且到了下一天還是會重複抓取前
一天抓取過的很多頁麵。這樣下來,爬蟲平均每天抓取不重複的頁麵數量就隻有10000頁的樣子了。那麼,要爬蟲把這個網
站所有的網頁抓取完需要的時間為:
800萬÷1萬頁=800天
其實,這個800天抓取完整個網站還是太理想化了。實際的情況是很多網站由於結搆的原因,有些網頁創建後4-5年,都還
沒有被爬蟲抓取過。
上麵的這個分析過程,都沒用到什麼驚天動地的計算方法。隻要你有一點數據分析的意識,就能看清楚事實的。當一個網
站收录不理想,大傢就應該去看看那些頁麵是不是被蒐索引擎爬蟲瀏覽過。如果一個網頁都沒有被蒐索引擎爬蟲瀏覽過,
是不可能會被收录的。一個網站的收录量沒有上去,那SEO流量的提昇就會有很大的一個瓶頸。
根據我們剛才上麵的那個分析過程,要提昇網站的收录量,首先要解決的就是蒐索引擎每天抓取網站的抓取量。
而:抓取量=爬蟲總的停留時間÷單頁頁麵的停留時間
一個網站,爬蟲總的停留時間在某個期間是保持相對固定的。當然,有方法提高爬蟲總的停留時間,不過這不是這篇文章
要講的內容。我們先通過減少單個頁麵的停留時間也可以增加爬蟲的抓取量。
減少爬蟲單個頁麵的停留時間,可以簡單的認為提高網頁的加載速度就可以了,雖然實際上這兩個因素之間還存在著一個
對應關係,但是這裡先不講。這個時候,網頁的加載速度就和抓取量之間有一個正比的關係,網頁加載速度越快,爬蟲整
個的抓取量就越大。抓取量越大,有效收录量就會增加,從而促使SEO流量增加,因為給一個大中型網站帶來流量的,90»¥
上都是長尾詞。大中型網站,有時甚至是小網站,隻要收录量增加一定的百分比,SEO流量也會增加一定的百分比。網頁的
加載速度,就和SEO流量之間建立了一個這樣的關係。
其實,Google也知道網頁速度和SEO流量之間的關係,所以早在“網站性能”這個功能推齣以前,就推齣了另一個功能讓大
傢去去用,那個功能就是“Google”網站管理員工具裡的“抓取統計信息”。哪裡把爬蟲對你網站的抓取量,和你網頁下
載的平均時間都列了齣來。
如果大傢平常註意觀察這裡麵的數據就會髮現這樣的規律:一旦網站下載時間減少了,那抓取量就會增大一點。
一般小網站,這樣的規律還不是太明顯。因為有其他影響整個規律的因素存在,而且小網站頁麵數太少了,爬蟲隨便多增
加幾百頁的抓取量就影響了50%上的抓取量。但是在大中型網站,這個規律是非常明顯的。如:
當這個網站加快了網頁加載速度,爬蟲的抓取量就穩步增加了。這個圖錶能很有利的證明上麵提到的理論。
這個圖錶也再次證明了《Google網站管理員工具》裡說的:“Google網站管理員工具裡的每個功能都是和SEO相關的”。 關於網頁速度和排名,Google否認曾經將網頁速度列為提高排名的因素。而Matt Cutts最近也說:In a nutshell- while
slow page load times won’t negatively inpact your rankings,fast load times may have a positive effect。把
它繙譯成:網頁加載速度慢,不會影響Google排名,但是網頁加載快卻有積极作用。拿掉以前那個繙譯中的“對排名”三
個字即可。至於其中的原因,我想通過這篇文章大傢都理解了吧。
這也是為什麼我在《內部鏈接還是外部鏈接》裡強調一下的:有時候是因為“你沒有掌握到他們那麼多信息,所以你無法
理解他們的話。也不會推測齣他們的潛檯詞以及他們沒有說全的話而已。”。