網站日志如何分析
做網站優化,數據分析是日常工作之一,數據分析包括很多方面,在這篇文章里筆者主要跟大家聊聊關于網站原始日志的分析。
網站原始日志不僅包括了用戶的點擊行為,同時也記錄了搜索引擎抓取及停留等動作,下面就以實例來進行網站日志分析,這里針對百度。
第一步:下載網站日志
網站日志需要在服務器下載(通常以logs命名),不懂如何下載的朋友可以咨詢技術人員(公司沒有專門技術的話可以咨詢服務器提供商),另外需要注意的是,有些服務器為了節約空間,沒有設置保留網站日志。
第二步:用Notepad++打開日志文件
Notepad++有強大的編輯能力,安裝也十分方便,大家可以自行搜索下載,下面是日志打開的截圖,一些數據篩選提取將從這里開始。
第三步:篩選出百度蜘蛛軌跡
百度蜘蛛是Baiduspider/2.0,所以我們按Ctrl+F調出查找功能,如圖:
在查找目標量輸入Baiduspider/2.0,** 后點擊“查找所有打開文件”,會在下方得出所有包含Baiduspider/2.0的行,如下圖:
第四步:抽出頁面url
1.先將所有查找出來的內容復制到另一個Notepad++窗口中,然后用兩次擴展替換,如圖:
這里簡單的說明,\n是換行的意思,我們通過兩次替換將頁面的url剝離出來成為一行,然后將所有內容復制粘貼到表格(xls)中,如圖:
接著利用xls的自動篩選功能,篩選出頁面url(看具體情況,一次篩選不成可進行多次篩選),如圖:
更多操作,比如說要看看tag頁面被抓取了多少,我們可以篩選包含tag的頁面,如圖:
到這里大家應該知道網站日志分析的基本流程和方法了,更多的細節分析大家可以根據具體的需求進行。
另外,知道了哪些頁面被抓取了,他們的收錄又是怎樣的呢?我們可以用Python來批量檢測,如圖:
關于網站原始日志的分析(優化方向)就到這里,希望能對大家有所幫助。
- 如何優化:
- 網站url改版不收錄 網站建設哪個 奉賢網站改版哪家好 公司網站改版價格會變嗎 網站改版注意哪些 陽江網站開發 孝義網站定制公司 日本跨境選品軟件網站開發 本溪網站定制報價 鄭州旅游網站開發運營