基于SEO的Log 日志分析软件应该提供那些功能?

news/2024/5/15 16:35:14/文章来源:https://blog.csdn.net/iteye_2238/article/details/81473340
基于SEO的Log 日志分析软件应该提供那些功能?



今天是连续第3个要过了12点才睡的日子了,希望今天可以告一个段落.

最近在考虑如何做基于 SEO 的日志分析工具, 每天都熬夜, 还真吃不消啊.


当用户在浏览器地址栏输入一个网址的时候,web服务器在返回用户需要页面的同时也记录用户的其他数据,比如用户的浏览器是什么牌子的,用户使用的IP地址,操作系统甚至记录了用户是输入的网址还是从其他链接跳转过来的等等。(好罗嗦)这部分记录无疑是最基础也是最重要的数据,很多web数据挖掘工作都是从这里作为起点进行的。

看过web服务器(比如apache , iis )日志的朋友们都知道,当用户访问一个页面产生的日志并不是只有一行,而是有很多行。稍加注意就会发现,web服务器为当前访问页面中包含的每个文件(图片、javascript脚本等)都生成了一行记录。这一行行的记录就组成了原始日志文件。

对SEO工作来说,分析日志是一项必不可少的基本功。与SEO最相关的信息莫过于搜索引擎的来访记录和从搜索引擎带来的流量2个指标。目前国内网站用户使用的web log 日志分析工具大多使用 awstats 一类的开源工具。可以说awstats的流行,与日志分析爱好者的引荐是有很大关系的比如车东等人。

虽然我也使用awstats等工具,但毫无疑问现在市场上专门针对seo的log日志分析工具还很少见。同时由于awstats采用perl编写,加上使用awstats自有的文件格式,这就导致了在awstats的基础上加以修改提供基于seo的日志分析功能也非容易之事。

那么基于SEO的日志分析应该提供那些功能呢,这就是我这几天想的问题.

目前已经实现了以下三个部分:

1.从原始日志文件中提取 页面访问 的记录 .(去掉 .js , .css , .jpg 等记录)见:"原始Log -> 页面 Log "

2.针对提取出的 页面访问记录 进行派重 (bloom filter), 提取唯一的访问记录.见:"页面Log -> sitemap "

3.针对提取出的 页面访问记录 ,提取从 google 和 baidu 过来的搜索关键词 记录.
见:"页面Log-> 搜索关键字分析"

准备提供的功能:
通用功能: 除去没有意义的请求(如JPG,GIF等), 分析真实的访问请求
多日日志: 蜘蛛的图表
单日日志: 蜘蛛的来访数字, 蜘蛛的来访时间段(这个很重要,可以判定搜索引擎更新频率)



alpha 下载地址





基于SEO的日志分析


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_871799.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

搜索引擎SEO外挂:一边搜索,一边看PageRank

搜索引擎SEO外挂:一边搜索,一边看PageRank 下载地址:多么乐站长工具 我原来曾写过一篇统计分析搜索引擎排名和Page Rank 关联分析 的文章。很多人引用,回复和我讨论了我的结论。有赞成的,有反对的,有鼓励…

SEO 比比看: Che168.com VS pcauto.com.cn

SEO 比比看: Che168.com VS pcauto.com.cn 做SEO工作,平常少不了多观察各种网站优化的案例。俗话说的好,懂行的看门道,不懂的看热闹。面对五花八门的网站,如何才能从专家的角度,以最快的速度来了解被观察网…

seo优化:把百度放进数据库

seo优化:把百度放进数据库 有时候我想,能把百度的数据放进数据库,用广大程序员熟悉的sql语句查询百度的搜索结果应该是一个不错的主意。在这方面Google早已经跨出了一大步,利用Google Search API 把Google的搜索结果放进数据库是很容易办到得…

PO模式+数据驱动(TPshop网站的登录模块进行单元测试以及区分正向逆向用例)

一、区分正向逆向用例 思路:在测试数据中添加一一个标识正向用例或逆向用例的标记:如:True/False 步骤: 调用登录方法(此登录方法中,只有输入用户名、输入密码、输入验证码、 点击登录按钮)判断用例标记:…

推荐一些网站给大家

推荐一些网站给大家 首先要隆重推荐http://www.moreofit.com/ 这个网站可以发现跟你输入网站类似的网站,如我们在地址栏中输入博客园的地址http://www.cnblogs.com/, 点击查看,系统会列出和博客园类似的网站,没准你会发现很多有意…

一篇文章学会独立在Windows server 2003虚拟机上搭建网站

本文学习:在Windows server 2003 虚拟机上的服务器搭建一个网站,非常详细,我都会了真的,有手就行。 Windowsiisaspaccess 环境:一台windows server 2003虚拟机。 准备工作什么也没有,开始搭建 开始测试搭建…

*.github.io的个人博客网站无法连接的问题

问题描述 就是这个样子的,类似*.github.io的网站都打不开,而且是手机电脑连接同一个WIFI,都打不开,但是我手机换了数据,就可以打开了,也是很奇怪,突然就这样了,我也不知道怎么回事&a…

Python多进程之刷小网站浏览量。

作者刚入门Python爬虫,如代码有问题,请大佬评论区指出!! 代码实现: 1,通过multiprocessing中的进程池实现多进程爬虫。 2,通过requests发起get请求刷浏览量。 代码: from multipr…

爬了招聘网站之后,总结Python学习的几点建议

来源商业新知网,原标题::爬了招聘网站之后,给你几点学习Python的建议 Python语言相关的岗位非常多,有运维,有自动化测试,有后端开发,有机器学习,如果想要快速上手&#x…

点击链接自动定位到网页某个具体位置和网站右侧导航介绍

页面点击链接后&#xff0c;自动定位到网页某个具体位置 <!DOCTYPE html> <html> <head> <meta http-equiv"Content-Type" content"text/html; charsetutf-8" /> <title>test</title> </head> <body> …

大型网站架构提速关键技术(页面静态化、memcached、Mysql优化)

大型网站关键技术介绍 1. pv值(page views),访问量大 带来问题 a. 流量大 10000000*2m ->解决方案 买带宽 ,优化程序(处理图片) b. 并发量,同时访问网站的人多.,解决方案 对程序的架构重新设计.->服务器集群 示意图: 1. 数据量大->10亿记录 解决方法是 a. 表的…

问答网站Quora副总裁杨蕾博士:让知识改变世界

????点击上方蓝字星标“Robinly”&#xff0c;获取更多重磅AI访谈 Robin.ly 是立足硅谷的视频内容平台&#xff0c;服务全球工程师和研究人员&#xff0c;通过与知名人工智能科学家、创业者、投资人和领导者的深度对话和现场交流活动&#xff0c;传播行业动态和商业技能&am…

Nginx对某个目录或整个网站进行登录认证的方法

比如要对 网站目录下的 test 文件夹 进行加密认证 首先需要在opt 的主目录中 /opt/ 创建一个新文件 htpasswd 此文件的书写格式是 用户名:密码 每行一个账户 并且 密码必须使用函数 crypt(3) 加密 官方档说 可以用 Apache 的 htpasswd 工具来创建密码文件 [rootlocalhost /]#…

网站分析基础概念之访问停留时间

类型&#xff1a;计数度量 定义&#xff1a;访问停留时间&#xff08;Visit Duration&#xff09;是指一次访问的持续时间。典型的计算方法是在一次访问中&#xff0c;用户最后一次操作发生的时间减去第一次操作发生的时间。 扩展&#xff1a; ● FAQ&#xff1a;为什么访问停留…

网站分析基础概念网页浏览数

■网页浏览数 类型: 计数度量 定义:网页浏览数&#xff08;Page Views&#xff0c;简称PV&#xff09;是指网页被浏览的次数。只要网页与服务器端完成一次请求&#xff0c;网页的浏览数就被累加一次。 说明&#xff1a;为了便于大家的理解&#xff0c;下面举例说明一下。下图是…

网站分析基础概念之新近度

类型&#xff1a;计数度量 定义&#xff1a;新近度&#xff08;Recency&#xff09;是指在一段时间内&#xff0c;访问过网站的访问者距离上次访问的时间间隔。也就是“访问频率”。 举例说明&#xff1a;2014年5月份&#xff0c;“综合购物网”的访问数&#xff08;Visits&…

网站站内数据分析

从来不喜欢说自己的感受。为什么呢&#xff0c;因为在现在这个社会&#xff0c;没有人会真正的去听你的感受。绝大多数人都只看重结果。所以即使有人问&#xff0c;我也不愿说。 一直以来&#xff0c;总喜欢给自己很大的压力。我是一个很怕被甩到后面的人。自尊心强&#xff0c…

python django学习制作一个音乐网站并将项目部署到阿里云服务器上

本音乐网站参考了黄永祥编写的书本《玩转Django 2.0》。 网址&#xff1a;http://xiaomokuaipao.com/ 欢迎关注公众号&#xff1a;Faster_Future 一、数据库的设计&#xff1a;1.歌曲信息表&#xff1a;记录了歌曲的信息。 2.歌曲分类表&#xff1a;实现歌曲的分类。 3.歌曲动…

web前端 html+css+javascript网页设计实例 企业网站制作

(案例源码链接在文章末尾&#xff0c;仅供学习参考) 一、在浏览器中的运行结果&#xff1a; 二、部分代码 1.HTML&#xff1a; <!DOCTYPE html> <html> <head lang"en"><meta charset"UTF-8"><title>启乐官网</title&g…

社会化分享bshare代码在网站中的使用(包括https下无效的解决方法)

一、代码的安装与放置 在bshare中选择好自己喜欢的代码样式之后&#xff0c;将代码复制进网站中 放入代码后&#xff0c;就会出现分享按钮。如果想要关键词和按钮平行显示的话&#xff0c;可利用table进行放置 显示结果如下&#xff1a;乌克兰玛丽塔医院 二、bshare代码在h…