網(wǎng)站日志里面記錄著每一個(gè)訪問信息,保存在服務(wù)器原始文件當(dāng)中。網(wǎng)站日志的信息比較準(zhǔn)確和全面。很多做網(wǎng)站優(yōu)化人員通過外界的工具來獲取數(shù)據(jù),其實(shí)網(wǎng)站日志就是真實(shí)的統(tǒng)計(jì)。
一、基本概念
1、網(wǎng)站日志就是一個(gè)純文本文件,里面記錄這網(wǎng)站的訪問信息,服務(wù)器的動(dòng)作,每一個(gè)文件調(diào)用的記錄。
2、網(wǎng)站日志用記事本打開就可以打開查看。
3、虛擬主機(jī)一般會(huì)提供網(wǎng)站日志下載,云主機(jī)和服務(wù)器可以直接在相應(yīng)的文件夾里面查看。
二、案例分享
剛才看了我博客的網(wǎng)站日志,我來分享一下網(wǎng)站的日志數(shù)據(jù)。
百度指數(shù)爬行記錄
Baiduspider/2.0 上圖是百度蜘蛛來爬行的記錄,我們可以看到爬行的時(shí)間,蜘蛛的IP地址,還能看到服務(wù)器的動(dòng)作,返回的代碼是否成功可以看返回的是:200,說名抓取成功。
360蜘蛛抓取記錄
360Spider 上圖是360蜘蛛抓取記錄,我們可以看出360的抓取頻率還是挺高的。依然可以看到抓取時(shí)間,抓取頁面,IP地址,還有是是否抓取成功,以及抓取所用時(shí)間。
谷歌爬蟲抓取記錄
搜狗蜘蛛爬行記錄
上圖是谷歌機(jī)器人Googlebot/2.1和搜狗蜘蛛Sogou+web+spider/4.0的網(wǎng)站抓取記錄。同樣記錄抓取網(wǎng)站頁面的信息。
到現(xiàn)在為止網(wǎng)站還在被各大搜索引擎抓取,百度平均每兩小時(shí)來一次,360平均每小時(shí)來一次,谷歌和搜狗每天來兩次。
三、常見的服務(wù)器狀態(tài)碼
1、301——永久轉(zhuǎn)向。
2、302——暫時(shí)轉(zhuǎn)向。
3、304——文件未改變,客戶端緩沖板版本還可以繼續(xù)使用。
4、400——非法請求。
5、401——訪問被拒絕,需要用戶名、密碼。
6、403——禁止訪問。
7、500——服務(wù)器內(nèi)部錯(cuò)誤,通常是程序有錯(cuò)。
8、503——服務(wù)器沒有應(yīng)答,可能是負(fù)載過大等。
總結(jié):
網(wǎng)站日志分析是做網(wǎng)站優(yōu)化工作的一部分,我們可以比較精準(zhǔn)的查看到網(wǎng)站的變化記錄和網(wǎng)站運(yùn)行是否爭正常,有助于我們優(yōu)化網(wǎng)站的結(jié)構(gòu)和程序,幫助我們進(jìn)一步提高網(wǎng)站質(zhì)量,更好的滿足用戶。當(dāng)我們把網(wǎng)站的用戶體驗(yàn)做到較好水平的時(shí)候,搜素引擎會(huì)認(rèn)真的保存我們的網(wǎng)頁快照,然后展示給用戶。