LogParser的IIS网站分析技巧

news/2024/5/18 2:45:04/文章来源:https://blog.csdn.net/weixin_30608503/article/details/97020568

LogParser介绍

LogParser是微软的一个免费的日志分析工具,它支持许多格式的文件类型。主要有如下几类:

· IIS 文件格式

Ø IISW3C: IIS产生的W3C扩展格式

Ø IIS: IIS专有格式.

Ø BIN: IIS的BIN格式.

Ø IISODBC: IIS可以把日志存储在数据库中。LogParser可以分析存储在数据库中的IIS日志.

Ø HTTPERR: Http.sys日志格式.

Ø URLSCAN: URLScan 日志格式.

· 通用文本格式

Ø CSV: 逗号分隔符文件.

Ø TSV: 以空格或者以制表符分隔的文件.

Ø XML: XML格式.

Ø W3C: W3C格式.

Ø NCSA: NCSA格式.

Ø TEXTLINE: 普通文件文件. LogParser可以按行返回内容

Ø TEXTWORD: LogParser可以把按字返回内容.

· 系统信息

EVT: 事件日志文件.

FS: 文件目录.

REG: 注册表格式.

ADS: AD信息.

另外还有一些其它格式,如NetMon, ETW等,在此不详述了。

LogParser原理

LogParser架构如下图所示:

clip_image001

注:图片引自http://e-mojo.net/wp-content/uploads/2009/11/logparser_architecture.gif

LogParser的核心为类SQL引擎,主要用于LogParser的SQL解析。使用LogParser我们可以把日志文件转换为很多格式,然后,我们可以用自己顺手的工具对其进行分析。

需要注意的是,如果我们要输出图形格式,必须安装Office Web组件。

 

IIS高级日志分析

本文主要介绍一些高级IIS日志分析功能,基本的分析功能请参考这些BLOG:

http://hi.baidu.com/tpxc/blog/item/b6e4561060f2ecf9c2ce7931.html

http://www.cnblogs.com/yonglun/archive/2007/02/20/652929.html

 

每天用户访问数

logparser "SELECT To_Date(TO_LOCALTIME(TO_TIMESTAMP(date, time))) AS [Date1], c-ip AS CIP INTO IISHC_DistinctClientIPPerDay.csv FROM *.log GROUP BY [Date1], CIP" -i:IISW3C -o:CSV -recurse:-1

我们按日期进行汇总,主要是利用Group by 实现。由于IIS日志中时间为UTC格式,因此,我们需要使用To_Date(TO_LOCALTIME(TO_TIMESTAMP(date, time)))把其转换为本地时间。

recurse:-1参数使LogParser对子目录下所有文件进行统计。

本例中产生一个CSV文件,我们可以使用Excel进行处理,得出每天用户数曲线(当然,我们也可以直接用LogParser产生图形)。如下是一个例子:

clip_image003

每小时用户访问数

logparser "SELECT TO_LOCALTIME(QUANTIZE(TO_TIMESTAMP(date, time),3600)) AS Hours, COUNT(*) AS Hits INTO IISHC_RequestsPerHour.csv FROM *.log where To_Date(TO_LOCALTIME(TO_TIMESTAMP(date, time)))=TIMESTAMP('10/08/2010','MM/dd/yyyy' ) GROUP BY Hours ORDER BY Hours" -i:IISW3C -o:CSV -recurse:-1

主要用法与上例类似。不过我们需要指定日期。指定日期在where To_Date(TO_LOCALTIME(TO_TIMESTAMP(date, time)))=TIMESTAMP('10/08/2010','MM/dd/yyyy' )中实现。

clip_image005

拆分文件

缺省情况下,IIS每天产生一个日志文件。对于一些特别繁忙的网站来说,IIS日志文件可能会非常大。我曾经有一个客户,每个日志文件有2个G之多。这么大的文件用LogParser进行分析时会非常慢,同时也很容易报错。

解决办法是把日志文件进行拆分成许多小文件分别进行分析。如下命令可以把一个IIS日志按小时分成24个文件:

logparser "SELECT REPLACE_CHR(REPLACE_CHR(TO_STRING(TO_LOCALTIME(QUANTIZE(TO_TIMESTAMP(date, time), 3600)), 'yyyy-MM-dd hh:mm:ss'), ':', '_'), ' ', '_'), date, time, c-ip, cs-uri-stem, cs-uri-query, sc-status, sc-substatus, sc-win32-status, sc-bytes, cs-bytes, time-taken FROM ex080114.log TO ex080114_*.log" -i:IISW3C -o:W3C

这里边的技巧请大家自己去理解J 怎么样?

附录

1. LogParser下载地址

http://www.microsoft.com/downloads/en/details.aspx?FamilyID=890cd06b-abf8-4c25-91b2-f8d975cf8c07&displaylang=en

2. Office 2003 Web Component

http://www.microsoft.com/downloads/en/details.aspx?FamilyId=7287252C-402E-4F72-97A5-E0FD290D4B76&displaylang=en

3. Security Update for Microsoft Office Web Components

http://www.microsoft.com/downloads/en/details.aspx?familyid=95c94c9a-6aca-42fb-9679-3234f06c72f7&displaylang=en

 

杜红俊

转载于:https://www.cnblogs.com/shpfe/archive/2010/11/05/1869934.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_787271.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

迪普网站防护系统产品线

迪普网站防护系统产品线 转载于:https://blog.51cto.com/itcn001/1064591

新闻资讯类网站的PC端前台模板分享

PC端新闻资讯模板背景效果图技术方案选型过程方案敲定结语背景 我同学公司需要开发一个pc端的新闻咨询网址,后端和app端都有了,具体一点就是已经有了后台监控和发布系统,并且实现了手机app端的新闻客户端页面,只差pc端资讯网站了…

【网易公开课】构建动态网站

第1集 第2集 第3集 正在播放...第4集 第5集 第6集 第7集 第8集 第9集 第10集 转载于:https://blog.51cto.com/hujieqi126/1088614

※如何给自己的网站添上分享到新浪微博的等分享功能?

分享到新浪微博代码示例: 只要选择以下代码嵌入自己的网页,即可将网站的信息分享到新浪微博。 使用说明: 复制并粘贴下面的JS代码,放到您的网页,可以在网页的任意位置放置。如果您的网站使用的模板,您也可以复制代…

iframe 无权限 不通网站_大型企业网站建设

大型企业网站建设,那么,关于大型企业网站建设还有哪些知识点呢? 网站易用性的定义。网站“易用性”是指在特定情境下,特定使用者使用网页的功能、效率以及他们对网站满意程度的衡量。一旦网站缺乏“易用性”设计或者是“易用性”设…

如何知道一个网站的后台地址_如何设计一个营销型网站

营销型网站并不是通用的设计,需要具体根据你所操作的行业具体分析来设计;行业网站功能需求的满足,网站需要有价值才会有营销咨询;营销在设计操作层面,就是真实案例介绍、服务行业、解决方案、更完善的网站用户体验、用…

JFinal_Blog通过360网站检测平台测试100分!

2019独角兽企业重金招聘Python工程师标准>>> JFinal_Blog通过360网站检测平台测试100分! 截图: 地址:http://webscan.360.cn/task/view/id/13893198965829 (猛戳查看) 转载于:https://my.oschina.net/craz…

python bottle支持https_用python web框架 bottle 开发网站(四)

在第三节我们熟悉并编写了用户登录逻辑,这一节我们要实现用户状态保持,就是判断用户当前的登录状态,我们用加密cookie的方式来实现,在bottle中用response.set_cookie()和requests.get_cookie()来写入和读取用户cookie,…

新网服务器网站后台怎么登陆,新网域名管理后台

在新网域名管理后台的系统中,您只需要拥有域名管理密码,即可以管理域名。域名证书的作用是证明域名所有权。如果您需要对网站进行备案时,需要提供给您的主机空间服务商。所有通过新网注册并交纳相应注册费用的用户均可通过新网域名自助管理平…

基于栅格的网站设计

如今,Grid-based(基于栅格的)网页设计已相当普遍,这意味着网页布局混乱的日子就要终结。尽管还无法用肉眼分辨,但我们的确是步入了有 序和结构化的时代。栅格布局整体趋于匀称,通常会使网页更加整洁美观。同…

html怎么做购物车页面,网站购物车界面(div+css实现)

叮咚网购物车.main{width:100%;height:590px;border:1px solid #000;text-decoration: none;}.top{width:100%;height:52px;border:1px solid #000;}.downMenu{width:100%;height:30px;font:normal normal 20px "宋体";color:#fff;background-color: #000000;}#searc…

iis发布网站问题-由于权限不足而无法读取配置文件,无法访问请求的页面

错误一: HTTP Error 500.19 - Internal Server Error 配置错误: 不能在此路径中使用此配置节。如果在父级别上锁定了该节,便会出现这种情况。锁定是默认设置的 (overrideModeDefault"Deny"),或者是通过包含 overrideMode"Deny…

python爬虫-爬取网站图片。

突然在网上看见自己喜欢的图片,想下载,只能一张图片一张图片的点击,想一想,你要下载的图片有10000张,那会是一个怎么样的画面,答案很简单,你会哭的,假如一张图片从搜索出来&#xff…

教你如何快速将网站开发为桌面应用

“ 教你如何快速开发桌面应用” 首先,我们来想像一下喜欢某个网站,或者我们自己有一个网站,在某个时间我们不知道怎么的突然想把某个网站做成我们自己桌面应用(不要问为什么,之前没有,现在得有)…

live2d 看板娘 简单添加看版娘到自己的网站

简单添加看版娘到自己的网站 关注公众号后台回复 “看板娘” 获取全部文件(接口,源代码)。 我们先来看一下我们的网站会变成什么样吧! http://www.djyqxbc.vip (官网)注意左下角。 简单制作一个简单的看板娘 点击左下角的4个方块(开始…

使用fiddler抓包工具替换网站文件

使用fiddler抓包工具替换网站文件 注:要知道如何替换,首先要学会fiddler的基础用法。1、抓包,2,抓图片的包。 要抓图片的包,如图,抓图片的包,前面的勾需要去除掉。 第一步:找到我们…

浏览器插件,轻松-快速获取网站源代码

浏览器插件,轻松-快速获取网站源代码 我们在学习和研究的时候,需要网站的源代码进行借鉴,但每次需要下载网站源代码,我们都需要找到一个,下载一个,每次只能下载一个文件,非常缓慢,而…

【python爬虫 2】BeautifulSoup快速抓取网站图片

前言 学习,最重要的是要了解它,并且使用它,正所谓,学以致用、本文,我们将来介绍,BeautifulSoup模块的使用方法,以及注意点,帮助大家快速了解和学习BeautifulSoup模块。有兴趣了解爬…

服务器上搭建wordpress动态网站

首先我们要有自己的服务器和租一个域名,这个可以根据自己情况自己去找,国内阿里,腾讯.国外也有很多.域名可以在万网或者腾讯上都可以买,之后要把域名指向自己服务器的ip地址(其实没有域名也可以打开网页,不…

egg解析html怎么指定数据,egg学习笔记第十六天:eggjs爬取数据并监控网站是否被篡改...

一、爬取百度新闻数据。①首先看下我们要爬取的网站数据:news.baidu.com②首先在service>spider.js下写入如下方法,写一个requestUrl方法 传入url并获取数据。"use strict";const Controller require("egg").Controller;class S…