现在的位置: 首页 > SEO技术 > 正文

服务器日志的分析方法

2016年12月04日 SEO技术 ⁄ 共 1211字 ⁄ 字号 暂无评论

服务器日志是由服务器自动生成的,是记录搜索引擎蜘蛛的爬取情况、用户访问页面、服务器异常状态的一个文档。Windows系统称为IIS日志,linux系统称为apache日志。服务器日志在哪里?利用服务器日志有可以分析出什么数据?我们一起来了解一下。

一、服务器日志的存在位置。

服务器日志存在于网站空间中,不同的空间商会略有不同,找不到的情况下询问空间商即可。这里以万网为例进行讲解。登录阿里云账号→进入管理控制台→选择左侧列表的云虚拟主机→点击虚拟主机最右侧的管理进入主机管理控制台→文件管理→网站日志下载(如下图所示)→下载。

 

  图一:万网空间日志下载位置

网站日志下载完成之后会出现这样的提示:“日志已下载到FTP服务器,请登录FTP下载日志文件。”日志文件存在与ftp的wwwlogs文件夹中,我们登录ftp下载下来即可。

二、服务器日志导入excel表格

当我们以记事本的形式打开服务器日志的时候,反应一堆密密麻麻的英文和数字,静竹SEO在这里分享一种方法,把日志导入excel表格中,数据便会一目了然。

新建一个wps表格(excel表)→打开→数据→导入数据→选择数据源(注意:文件格式要改成所有文件,否则是看不到日志的)→打开→下一步→下一步→选择分隔符号(tab键和空格同时选中)→完成。数据就导入到excel表格中了。

 

  图二:excel表格导入数据源

 

  图三:导入网站日志分隔符的选择

三、服务器日志分析。

导入表格的数据清晰明了,每一行都是一个访问量(包括蜘蛛和用户),每一列代表同一组数据。有些数据我们也需要用常识去判断。如下图所示,第一列是用户的ip地址,第四列是日期时间,“11/Jan/2016”表示2016年1月11日。二三五列的每一行都是相同的数据,没有对比参考意义,在分析数据的时候可隐藏或删除。

 

  图四:网站日志导入excel表格中的格式

网站日志的数据有很多列,我们在分析日志的时候只需要留下“用户IP、用户信息、时间、被访问的页面、http状态码”这五项即可。整理后的日志如下图所示。(用户信息通常是最多信息的那一列)。我们可以清晰的看到哪个ip在什么时间访问了我们网站的哪个页面。搜索引擎蜘蛛也是有自己的ip段的,可以在百度上搜索辨别。

 

  图五:优化后的网站日志结构

四、http状态码的筛选。

用户访问任何一个页面,服务器都会返回一个三位数的状态码,这个状态码用户是看不到的,可以通过站长工具查询到,每个状态码都代码网站的不同情况,其中200是能够正常访问的页面。更多状态码信息可以参考上一篇文章。通过状态码这一列可以看到服务器的实时状态。给表格做一下筛选,选中“http状态码”这个单元格,点击自动筛选。

 

  图六:给http状态码做一个筛选功能

然后点击单元格的箭头可以筛选出单一返回码的页面。例如只选择404,我们就可以看到哪些页面是不存在的。根据http状态码找出问题,及时解决。

 

给我留言

留言无头像?