JS--网站统计中的数据收集原理及实现

news/2024/5/9 6:35:50/文章来源:https://blog.csdn.net/qq_34941023/article/details/54731288

来源:http://blog.codinglabs.org/articles/how-web-analytics-data-collection-system-work.html


网站数据统计分析工具是网站站长和运营人员经常使用的一种工具,比较常用的有谷歌分析、百度统计和腾讯分析等等。所有这些统计分析工具的第一步都是网站访问数据的收集。目前主流的数据收集方式基本都是基于javascript的。本文将简要分析这种数据收集的原理,并一步一步实际搭建一个实际的数据收集系统。

数据收集原理分析

简单来说,网站统计分析工具需要收集到用户浏览目标网站的行为(如打开某网页、点击某按钮、将商品加入购物车等)及行为附加数据(如某下单行为产生的订单金额等)。早期的网站统计往往只收集一种用户行为:页面的打开。而后用户在页面中的行为均无法收集。这种收集策略能满足基本的流量分析、来源分析、内容分析及访客属性等常用分析视角,但是,随着ajax技术的广泛使用及电子商务网站对于电子商务目标的统计分析的需求越来越强烈,这种传统的收集策略已经显得力不能及。

后来,Google在其产品谷歌分析中创新性的引入了可定制的数据收集脚本,用户通过谷歌分析定义好的可扩展接口,只需编写少量的javascript代码就可以实现自定义事件和自定义指标的跟踪和分析。目前百度统计、搜狗分析等产品均照搬了谷歌分析的模式。

其实说起来两种数据收集模式的基本原理和流程是一致的,只是后一种通过javascript收集到了更多的信息。下面看一下现在各种网站统计工具的数据收集基本原理。

流程概览

首先通过一幅图总体看一下数据收集的基本流程。





首先,用户的行为会触发浏览器对被统计页面的一个http请求,这里姑且先认为行为就是打开网页。当网页被打开,页面中的埋点javascript片段会被执行,用过相关工具的朋友应该知道,一般网站统计工具都会要求用户在网页中加入一小段javascript代码,这个代码片段一般会动态创建一个script标签,并将src指向一个单独的js文件,此时这个单独的js文件(图1中绿色节点)会被浏览器请求到并执行,这个js往往就是真正的数据收集脚本。数据收集完成后,js会请求一个后端的数据收集脚本(图1中的backend),这个脚本一般是一个伪装成图片的动态脚本程序,可能由php、python或其它服务端语言编写,js会将收集到的数据通过http参数的方式传递给后端脚本,后端脚本解析参数并按固定格式记录到访问日志,同时可能会在http响应中给客户端种植一些用于追踪的cookie。



本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_848790.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

某个在线学习网站提交学习进度的方式

没到月底,领导要求我们完成公司网站的学习进度,于是想搞清楚这个在线学习网站更新学习进度的方法,可以快速更新学习进度,算是解决了学习任务的紧迫性。一开始看到一个按键,当学习快结束是,网站会提示”我已…

网站用户登录过程中的cookie的作用

测试一个学习平台项目时,需要验证用户账号是否可以正常登录。使用jmeter工具测试,fiddler辅助查看请求和响应消息。 开始的想法很简单,在登录页面查看到,点击登录按键会出发一个POST请求,想通过jmeter模拟post请求&am…

网站jar包功能分析

agileggfw.agilemgr.jar包引用了HibernateTransactionManager和FreeMarkerViewResolver 还不清楚做什么的 agileggfw.captcha.jar包引用jcaptcha-1.0.jar&#xff0c;作用是生成验证码&#xff1a; JCaptcha 简介 <?xml version"1.0" encoding"UTF-8&qu…

网站引导功能实现

网站新上线一个功能&#xff0c;往往会有一些引导功能&#xff0c;其实很简单&#xff0c;就是一些做好的图片通过css,js控制&#xff0c;拼接在一起。 上一些来自百度网的截图&#xff0c;一看就明白。

每个软件开发人员都应关注的7个网站

1. DEV社区 这是一个伟大的网站&#xff0c;可以随时了解最新技术以及下一轮繁荣。您可以关注自己感兴趣的主题。文章和视频的供稿将根据您的喜好生成。 只需访问网站并搜索您想要探索的技术和概念。您将获得许多相同的文章&#xff0c;视频和播客教程。它的技术新闻版块将使您…

测试基于php的购物网站,基于ThinkPHP开发的购物网站-微淘淘开发笔记

历经半个多月的断断续续的编写&#xff0c;一款基于ThinkPHP的购物网站开发完成并完成了初步的测试检测与修复&#xff0c;这款程序可以称之为到现在为止完全我自己独立编写完成的最大规模的一个 PHP 程序&#xff0c;为其起名叫做微淘淘&#xff0c;随便起的。由于使用的 TP 开…

html页面去空白页,通过Iframe在A网站页面内嵌入空白页面的方式,跨域获取B网站的数据返回给A网站!_html/css_WEB-ITnose...

以下代码只是为演示该方法具体是如何操作的&#xff0c;实际的意义并不大。其实这个方法还可以解决很多方面的跨域操作&#xff0c;以下两点为我工作中遇到的情况&#xff01;比如A系统中打开B系统页面的时候&#xff0c;获取B系统页面高度&#xff0c;A系统中可以动态设置窗口…

程序员本地网站

这道题要求从本地访问&#xff0c;打开burpsuite抓包&#xff0c;加上&#xff1a;X-Forwarded-For: 127.0.0.1 就好了 X-Forwarded-For: 简称XFF头&#xff0c;它代表客户端&#xff0c;也就是HTTP的请求端真实的IP&#xff0c;只有在通过了HTTP 代理或者负载均衡服务器时才会…

推荐几个正经网站,让你的数据结构和算法学习事半功倍!

前言 相信对于大部分程序员来说&#xff0c;数据结构和算法学起来是比较难的&#xff0c;但是它在工作中又是非常的重要&#xff0c;可以说是开发中的一块基石。 所以为了更好的学习和理解数据结构和算法&#xff0c;当时我是趁着双十一搞活动买了几本算法书&#xff0c;打算一…

AboutDNN网站链接交换图标

重新设计一个AboutDNN.com网站的图标。 标准的88*31像素的图标&#xff1a; 图片地址&#xff1a;http://www.aboutdnn.cn/logo/AboutDNN_com_88_31.gif 图片地址&#xff1a;http://www.aboutdnn.cn/logo/aboutdnn_com_120_30.gif 图片地址&#xff1a;http://www.aboutdnn.cn…

介绍一个不错的图书下载网站-顺便推荐几本书

站长肯定是个程序员&#xff0c;因为注册该网站的时候居然要做一程序题&#xff0c;像面试一样&#xff0c;很有意思。这个网站上几乎有所有计算机方面有点名的著作&#xff0c;而且站长非常勤奋&#xff0c;差不多天天都有新书上传。这个站名叫皮皮书屋&#xff0c;地址&#…

大型高性能网站的十项规则【转】

在我们公司ChinaNetCloud&#xff0c;见 过多种不同类型的网站和系统&#xff0c;有好也有差。其中有些系统拥有良好的服务器/网络架构&#xff0c;并且进行了合理的调整和监控 &#xff1b;然而一般的系统都会有安全和性能上的 问题&#xff0c;不能良好运行&#xff0c;也无法…

linux网站服务

文章目录linux网站服务概念名词网站架构静态站点Apache虚拟主机动态网站部署论坛系统discuz部署博客系统wordpresslinux网站服务 概念 名词 HTML HyperText Markup Language超文本标记语言。网页 使用HTML,PHP,JAVA语言格式书写的文件&#xff0c;网页就是服务器把html文件拷…

如何构建一个优秀的移动网站?谷歌专家教你25招(四)[转]

▌16、在需要选择日期的时候&#xff0c;提供一个可视化日历 当用户在移动网站上预定航班时&#xff0c;很难确定“下周的某一天”是几月几号&#xff0c;所以你需要提供一个可视化日历供用户勾选日期。这样用户就不需要离开你的网站&#xff0c;然后在打开手机上的日历App应用…

_00019 Storm架构介绍和Storm获取案例(简单的官方网站Java案例)

博文作者&#xff1a;妳那伊抹微笑 itdog8 地址链接 : http://www.itdog8.com&#xff08;个人链接&#xff09; 博客地址&#xff1a;http://blog.csdn.net/u012185296博文标题&#xff1a;_00019 Storm的体系结构介绍以及Storm入门案例(官网上的简单Java案例)个性签名&#x…

大数据实训05--网站离线日志分析实战

用户行为分析 是指在获得网站访问量基本数据的情况下&#xff0c;对有关数据进行统计、分析&#xff0c;从中发现用户访问网站的规律&#xff0c;并将这些规律与网络营销策略等相结合&#xff0c;从而发现目前网络营销活动中可能存在的问题&#xff0c; 并为进一步修正或重新制…

科研网站推荐

科研网站推荐学习网站综述参考文献科研工具实用工具流程图二维码学习网站 廖雪峰的官方网站国家自然科学基金委员会项目公布 综述 paper-digest &#xff1a;输入论文DOI号&#xff0c;AI生成文章介绍PAPER DIGEST &#xff1a;输入研究方向&#xff0c;AI寻找相关论文并将其…

快速搭建个人网站

目录宝塔简介tomcat购买云服务器下载与配置上传文件域名本次实验使用宝塔、tomcat等工具快速的搭建个人网站。 宝塔简介 宝塔Linux面板是提升运维效率的服务器管理软件&#xff0c;支持一键LAMP/LNMP/集群/监控/网站/FTP/数据库/JAVA等100多项服务器管理功能。 tomcat Tomc…

go语言学习网站大全

最近在学习go语言&#xff0c;搜集了一些学习网站&#xff0c;也有大量的面试题&#xff0c;及练手项目 分享给大家&#xff0c;一起学习 可以关注我的公众号&#xff1a;菜鸟内推 分享求职干货&#xff0c;大厂面经~ go语言系列 go Interview 语雀 https://www.yuque.com/go…

SEO

解释&#xff1a; SEO是由英文Search Engine Optimization缩写而来&#xff0c; 中文意译为“搜索引擎优化”。SEO是指通过站内优化比如网站结构调整、网站内容建设、网站代码优化等以及站外优化。 关于SEO&#xff0c;严谨的定义如下&#xff1a;SEO是指在了解搜索引擎自然排名…