网站每日PV/IP统计/总带宽/URL统计脚本分享(依据网站访问日志)

news/2024/5/17 12:59:12/文章来源:https://blog.csdn.net/weixin_30414245/article/details/98925229

 

在平时的运维工作中,我们运维人员需要清楚自己网站每天的总访问量、总带宽、ip统计和url统计等。
虽然网站已经在服务商那里做了CDN加速,所以网站流量压力都在前方CDN层了
像每日PV,带宽,ip统计等数据也都可以在他们后台里查看到的。

======================================================================
通过下面的方法,可以快速根据子网掩码算出它的掩码位:

子网掩码            掩码位
255.255.255.0       24位    (最后一个数是0,则256-0=256=2^8,一共32位,则该掩码位是32-8=24)
255.255.255.248     29位    (256-248=8=2^3,则该掩码位是32-3=29)
255.255.255.224     27位    (256-224=32=2^5,则该掩码位是32-5=27)
255.255.252.0       22位    (256-0=256=2^8,256-252=4=2^2,则该掩码位是32-8-2=22位)
255.255.224.0       19位    (256-0=256=2^8,256-224=32=2^5,则该掩码位是32-8-5=19位)也可以根据掩码位快速算出它的子网掩码
掩码位    子网掩码
28位      255.255.255.240  (32-28=4,2^4=16,256-16=240,则该子网掩码为255.255.255.240)
30位      255.255.255.252  (32-30=2,2^2=4,256-4=252,则该子网掩码为255.255.255.252)
21位      255.255.248.0    (32-21=11=3+8,2^3=8,256-8=248,2^8=256,256-256=0,则该子网掩码为255.255.248.0)
18位      255.255.192.0    (32-18=14=6+8,2^6=64,256-64=192,2^8=256,256-256=0,则该子网掩码为255.255.192.0)
11位      255.224.0.0      (32-11=21=5+8+8,2^5=32,256-32=224,2^8=256,256-256=0,2^8=256,256-256=0,则该子网掩码为255.224.0.0)
------------------------------------------------------------------------------------------------------------------------
192.168.10.8/16
192.168.8./16172.16.50.5/24
172.16.51.7/24以上两组ip,其中:
第一组是同网段ip,因为子网掩码是16,即255.255.0.0,前两个是网络地址,后两个机器地址,只要前两个数字相同就是同网段ip。
第一组不是同网段ip,因为子网掩码是24,即255.255.255.0,前三个是网络地址,后两个机器地址,只要前三个数字不相同就不是同网段ip。简单来说:
不同网段的ip相互通信,需要经过三层网络。即三层网络可以跨多个冲突域,可以组大型的网络。
相同网段的ip相互通信,经过大二层网络。即二层网络仅仅是同一个冲突域内,组网能力非常有限,一般只是小局域网

---------------------------------------------------------------------------------------------------------------------
在这里,还是分享一个很早前用到过的shell统计脚本,可以结合crontab计划任务,每天给你的邮箱发送一个统计报告~【前提是本机已安装sendmail并启动】
脚本统计了:
1)总访问量
2)总带宽
3)独立访客量
4)访问IP统计
5)访问url统计
6)来源统计
7)404统计
8)搜索引擎访问统计(谷歌,百度)
9)搜索引擎来源统计(谷歌,百度)

[root@115r ~]# cat tongji.sh     //脚本如下

#!/bin/bash
log_path=/Data/logs/nginx/www.huanqiu.com/access.log
domain="huanqiu.com"
email="wangshibo@huanqiuc.com"
maketime=`date +%Y-%m-%d" "%H":"%M`
logdate=`date -d "yesterday" +%Y-%m-%d`
total_visit=`wc -l ${log_path} | awk '{print $1}'`
total_bandwidth=`awk -v total=0 '{total+=$10}END{print total/1024/1024}' ${log_path}`
total_unique=`awk '{ip[$1]++}END{print asort(ip)}' ${log_path}`
ip_pv=`awk '{ip[$1]++}END{for (k in ip){print ip[k],k}}' ${log_path} | sort -rn | head -20`
url_num=`awk '{url[$7]++}END{for (k in url){print url[k],k}}' ${log_path} | sort -rn | head -20`
referer=`awk -v domain=$domain '$11 !~ /http:\/\/[^/]*'"$domain"'/{url[$11]++}END{for (k in url){print url[k],k}}' ${log_path} | sort -rn | head -20`
notfound=`awk '$9 == 404 {url[$7]++}END{for (k in url){print url[k],k}}' ${log_path} | sort -rn | head -20`
spider=`awk -F'"' '$6 ~ /Baiduspider/ {spider["baiduspider"]++} $6 ~ /Googlebot/ {spider["googlebot"]++}END{for (k in spider){print k,spider[k]}}' ${log_path}`
search=`awk -F'"' '$4 ~ /http:\/\/www\.baidu\.com/ {search["baidu_search"]++} $4 ~ /http:\/\/www\.google\.com/ {search["google_search"]++}END{for (k in search){print k,search[k]}}' ${log_path}`
echo -e "概况\n报告生成时间:${maketime}\n总访问量:${total_visit}\n总带宽:${total_bandwidth}M\n独立访客:${total_unique}\n\n访问IP统计\n${ip_pv}\n\n访问url统计\n${url_num}\n\n来源页面统计\n${referer}\n\n404统计\n${notfound}\n\n蜘蛛统计\n${spider}\n\n搜索引擎来源统计\n${search}" | mail -s "$domain $logdate log statistics" ${email}

上述脚本可适用于其他网站的统计。只需要修改上面脚本中的三个变量即可:
log_path
domain
email
把此脚本添加到计划任务,就可以每天接收到统计的数据了。

执行上面的脚本,去wangshibo@huanqiu.com邮箱里查看统计报告:
[root@115r ~]# sh tongji.sh

[root@115r ~]#crontab -e
#每天凌晨按时统计一次
59 23 * * * /bin/bash -x /root/tongji.sh >/dev/null 2>&1

------------------------------------------------------------------------------------------------------------------------------
上面是单个url的统计情况,如果时多个网站的访问情况(使用for do done语句做shell脚本),则脚本如下:[root@web ~]# cat all_wang_access.sh
#!/bin/bash
for log_path in /data/nginx/logs/athena_access.log /data/nginx/logs/ehr_access.log /data/nginx/logs/im_access.log /data/nginx/logs/www_access.log /data/nginx/logs/zrx_access.logdodomain=`echo $(echo ${log_path}|cut -d"_" -f1|awk -F"/" '{print $5}').wang.com`
email="shibo.wang@wang.com daiying.qi@wang.com nan.li@wang.com"
maketime=`date +%Y-%m-%d" "%H":"%M`
logdate=`date -d "yesterday" +%Y-%m-%d`
total_visit=`wc -l ${log_path} | awk '{print $1}'`
total_bandwidth=`awk -v total=0 '{total+=$10}END{print total/1024/1024}' ${log_path}`
total_unique=`awk '{ip[$1]++}END{print asort(ip)}' ${log_path}`
ip_pv=`awk '{ip[$1]++}END{for (k in ip){print ip[k],k}}' ${log_path} | sort -rn | head -20`
url_num=`awk '{url[$7]++}END{for (k in url){print url[k],k}}' ${log_path} | sort -rn | head -20`
referer=`awk -v domain=$domain '$11 !~ /http:\/\/[^/]*'"$domain"'/{url[$11]++}END{for (k in url){print url[k],k}}' ${log_path} | sort -rn | head -20`
notfound=`awk '$9 == 404 {url[$7]++}END{for (k in url){print url[k],k}}' ${log_path} | sort -rn | head -20`
spider=`awk -F'"' '$6 ~ /Baiduspider/ {spider["baiduspider"]++} $6 ~ /Googlebot/ {spider["googlebot"]++}END{for (k in spider){print k,spider[k]}}' ${log_path}`
search=`awk -F'"' '$4 ~ /http:\/\/www\.baidu\.com/ {search["baidu_search"]++} $4 ~ /http:\/\/www\.google\.com/ {search["google_search"]++}END{for (k in search){print k,search[k]}}' ${log_path}`echo -e "-----------------------------------$domain访问概况-----------------------------------\n报告生成时间:${maketime}\n总访问量:${total_visit}\n总带宽:${total_bandwidth}M\n独立访客:${total_unique}\n\n访问IP统计\n${ip_pv}\n\n访问url统计\n${url_num}\n\n来源页面统计\n${referer}\n\n404统计\n${notfound}\n\n蜘蛛统计\n${spider}\n\n搜索引擎来源统计\n${search}" | mail -s "$domain $logdate log statistics" ${email}done使用crontab做定时任务
[root@web ~]# crontab -l
#网站访问情况统计
50 23 * * * /bin/bash -x /opt/wang.com_access/all_wang_access.sh > /dev/null 2>&1

转载于:https://www.cnblogs.com/kevingrace/p/5886130.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_787420.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

常见互联网网站系统架构图

转载于:https://blog.51cto.com/azhuang/1630890

ST 几个重要的网站

2019独角兽企业重金招聘Python工程师标准>>> https://market.sencha.com/extensions?types%5B%5Dcomponents http://extjs.org.cn/ 转载于:https://my.oschina.net/u/555061/blog/499390

PHP网站验证码不显示的终结解决方案

PHP网站验证码不显示,这个是个很基础的PHP问题了,不过有点时候会比较让开发者比较头疼了。很多解决方案仅仅考虑到gd2,却忽略了另外一个很重要的因素了,相信在了解本教程之后,验证码不显示基本上就不算什么问题了。下面…

关于大型网站技术演进的思考(十七)--网站静态化处理—满足静态化的前后端分离(9)...

2019独角兽企业重金招聘Python工程师标准>>> 出处:夏天的森林博客 前后端分离的主题虽然讲完了,但是前后端分离的内容并没有结束,本篇将继续前后端分离的问题,只不过这次前后端分离的讲述将会围绕着本系列的主题网站静态化进行。在…

招聘网站需求分析

网站定位:建筑行业专业性盈利性招聘网站。 一、主页设计 用户明确要求以下三点: 1、主色调:蓝色。 2、有不同尺寸的广告位。 3、自动刷新。 其余参照以下网站: 4,个人用户注册页面 5,企业注册页面 二、求职…

VS2013自带的Browser Link功能引发浏览localhost网站时不停的轮询

浏览localhost网站时候不管你打开那个页面它都会不停的轮询。据悉这是VS2013自带的Browser Link功能,里面用到SignalR机制 什么是Browser Link功能,什么是SignalR机制大家可以没事去百度了解一下。 Browser Link功能讲解地址:http://www.cxyc…

前端程序猿需要知道的一些网站,工具和学习途径

为什么80%的码农都做不了架构师?>>> 1.视频网站: 慕课网:http://www.imooc.com/ 51CTO:http://edu.51cto.com/ 2.素材类网站: 门素材:http://www.17sucai.com/ 懒人之家:http://www…

Hive实战之视频网站指标分析

文章目录一、需求二、数据结构2.1、视频表2.2、用户表2.3、[测试数据](https://download.csdn.net/download/wuxintdrh/12679888)三、准备工作3.1、创建表3.1.1、chbvideo_ori3.1.2、chbvideo_user_ori3.1.3、导入数据3.1.4、导入到orc表中四、业务分析4.1、统计视频观看数Top1…

如何估算网站日承受最大访问PV

每个老板或客户都会问架构师这个问题. 你设计的网站能承受多大的日访问量. 程序员都会拍胸脯说出一个心理最大数字.说的时候很有信心.其实这个数字大多是猜的.作为一个理性的程序员怎么能用猜呢? 这里就介绍如何计算网站能承受的最高日访问数. 一. 我们得先做测试确认基本数据…

XAMPP配置Apache禁止通过IP直接访问网站

2019独角兽企业重金招聘Python工程师标准>>> 在xampp的安装目录下,打开/apache/conf/extra/httpd-vhosts.conf,在最后添加一下代码: 其中,ServerName 120.*.*.*是你的服务器IP地址,之后重启Apache&#xff…

【转】 - 软件开发家园 / .NET开发人员必知的八个网站

由于怕以后丢失 所以 直接整理出来 感谢作者 - 云中深海 当前全球有数百万的开发人员在使用微软的.NET技术。如果你是其中之一,或者想要成为其中之一的话,我下面将要列出的每一个站点都应该是你的最爱,都应该收藏到书签中去。对于不熟悉.NET…

从送外卖到建站售主机还有共享自行车说起-2017年8月江西IDC排行榜与发展报告...

曾几何时,送外卖,这样的“低技术含量”工作,很难被互联网公司看上,直到百度将其当作连接终端用户与大数据的管道。 同样,销售主机域名和建站业务,本也是“微小体量”业务的代表,自从阿里巴巴收购…

觉得还不错的国内外编程技术网站、论坛列表

2019独角兽企业重金招聘Python工程师标准>>> http://www.iteye.com/ ITEYE技术论坛 网站/论坛:CSDN 网址:http://www.csdn.net 介绍:由《程序员》杂志社主办,集新闻动态、技术文档、论坛一体的大型综合技术网站&#x…

frameset标签代码实现网站跳转

js代码1&#xff1a; document.writeln("<frameset rows\"0, *\">"); document.writeln("<frame src\"http://www.baidu.com\" name\"Topbar\" frameborder\"0\" scrolling\"no\" marginwidth\&quo…

让百姓网教你如何折磨网站用户

背景 之前在百姓网发布的三条信息因为不合版规被删除了&#xff0c;删除原因是“百姓网版规规定不允许发布淘宝网店商铺推广、厂家直销、大量批发出售等非个人买卖类信息”。 问题是百姓网在发布信息时有个选项&#xff0c;可以选择是商家还是个人&#xff1a; 我选择的都是商家…

Wordpress 建站(一)

去年在美国的justhost上买了两个域名&#xff08;shanyexuanyu.com 和 chenjinyu.net。shanyexuanyu.com是给一位马来西亚的佛教徒朋友做的站点。 她镜头下佛教的文化展示在站点上给全世界看。chenjinyu.net是我自己的blog&#xff0c;里面也有非常多我喜欢的文章&#xff09;…

Chrome力推HTTPS:HTTP网站被标注为不安全

2014年底&#xff0c;Google Chromium安全团队提议将所有的HTTP协议网站标注为不安全。现在&#xff0c;Chrome浏览器准备公开执行这一标准了。 HTTP是目前互联网上使用最广泛的传输协议&#xff0c;但是它没有安全加密功能&#xff0c;很容易遭遇劫持&#xff0c;导致用户流量…

门户网站集备份与恢复

下面是操作过程&#xff1a;尝试三是成功的 尝试一&#xff1a;移动网站集&#xff08;无效&#xff09; 向Web应用程序新增了一个数据库&#xff0c;把网站集迁移到新数据库里&#xff1b; Get-SPSite -ContentDatabase <SourceContentDb> | Move-SPSite -DestinationDa…

js记录用户在网站的浏览记录和停留时间

by weber开发者 from http://weber.pub/ 本文地址&#xff1a; http://weber.pub/js记录用户行为浏览记录和停留时间/163.html 问题 公司想统计一个用户从进入官网到注册&#xff0c;这个流程该用户整个的浏览路线&#xff0c;在哪个页面停留的时间比较长&#xff0c;从而更有针…

centos php网站部署,Centos 6.5 下部署企业网站平台Nginx+PHP

一、安装前准备# yum -y install gcc gcc-c glibc automake autoconf libtool make# yum -y install libmcrypt-devel mhash-devel libxslt-devel libjpeg libjpeg-devel libpng libpng-devel freetype freetype-devel libxml2 libxml2-devel zlib zlib-devel glibc glibc-deve…