网站用户身份标识的识别

news/2024/5/18 15:04:59/文章来源:https://blog.csdn.net/weixin_34406086/article/details/92025596

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

用户分析是网站分析中一个重要的组成部分,在分析用户之前我们必须首先能够识别每个用户,分辨哪些是”New Customer”,哪些是”Repeat Customer”。这样不但能够更加清晰地了解到底有多少用户访问了你的网站,分辨他们是谁(用户ID、邮箱、性别年龄等);同时也能够帮助你更好地跟 踪你的用户,发现它们的行为特征、兴趣爱好及个性化的设置等,以便于更好地把握用户需求,提升用户体验。

通常当你的网站提供了注册服务,而用户注册并登陆过你的网站,那么用户可以更容易地被识别,因为网站一般都会保存注册用户的详细信息;但是你的网站并不需要注册,而用户的行为以浏览为主,这是用户识别就会显得较为困难,下面提供了几种常用的用户识别的方法:

识别用户的几种方法

当用户并未注册登录的情况下,识别用户的唯一途径就只剩下用户浏览行为的点击流数据,通常情况下它们会保存在WEB日志里面,关于WEB日志的详细说明可以参考我之前的文章——WEB日志格式。而WEB日志本身存在的缺陷可能导致用户识别的不准确性,关于WEB日志的缺陷可以参考之前的文章——WEB日志的作用和缺陷,所以我们在选择用户识别方法的过程中,在条件允许的情况下尽量选择更为准确的方法:

1、基于IP的用户识别

IP地址是最容易获取的信息,任何的WEB日志中均会包含,但其局限性也较为明显:伪IP、代理、动态IP、局域网共享同一公网IP出口……这些情况都会影响基于IP来识别用户的准确性,所以IP识别用户的准确性比较低,目前一般不会直接采用IP来识别用户。

获取难度:★

准确度:★

2、基于IP+Agent的用户识别

同样基于最简单形式的WEB日志,我们可以增加一项——Agent,来提高单一IP方式识别用户的准确性。Agent也是WEB日志中一般都会 包含的信息,通过IP+Agent的方式可以适当提高IP代理、公用IP这类情况下用户的分辨度,同时通过Agent还可以识别网络爬虫等特殊“用户”, 但同样准确度也欠高。

获取难度:★

准确度:★★

3、基于cookie的用户识别

当你通过自定义Apache日志格式或者JavaScript的方法获得用户cookie的时候,其实你已经找到了一个更有效的用户识别的手 段。cookie在未被清除的其前提下可以认为是跟某个访问客户端电脑绑定的(一个客户端有可能包含多个cookie),所以用cookie来标识用户其 实指的是用户使用的客户端电脑,而并非用户本身。

用cookie识别用户的方法当然也存在缺陷:最常见的就是cookie被清除而导致用户无法与原先记录实现对应;同时由于客户端电脑会被共用,或者用户会在不同的电脑上访问你的网站,这个时候cookie就无法直接对应到该用户了。

获取难度:★☆

准确度:★★☆

4、基于用户ID的用户识别

基于用户ID的用户识别是最为准确,因为一般情况下用户不同共享他的用户ID,所以我们可以认为数据中的userid唯一地指向该用户,几乎不 存在偏差。当然要使用用户ID来识别用户是需要一定的前提条件的:网站必须是提供用户注册登录服务的,并且可以通过一些手段在点击流数据中记录 userid。

获取难度:★★

准确度:★★★

所以对于一个需要用户ID注册登录的网站来说,用户唯一标识符的选择可以遵从以下顺序:当用户注册登录时以userid为准,当用户在未登录状 态浏览时以用户的cookie为准,当用户未登录且cookie无法获取的情况下以IP+Agent为准;这样就能从最大程度上识别唯一用户。

这里推荐一个网站日志中cookie项的自定义设置方法,以便更好地识别用户。cookie是从用户端存放的cookie文件记录中获取的,这 个文件里面一般在包含一个cookieid的同时也会记下用户在该网站的userid(如果你的网站需要注册登陆并且该用户曾经登录过你的网站且 cookie未被删除),所以在记录日志文件中cookie项的时候可以优先去查询cookie中是否含有用户ID类的信息,如果存在则将用户ID写到日 志的cookie项,如果不存在则查找是否有cookieid,如果有则记录,没有则记为”-”,这样日志中的cookie就可以直接作为最有效的用户唯 一标识符被用作统计。当然这里需要注意该方法只有网站本身才能够实现,因为用户ID作为用户隐私信息只有该网站才知道其在cookie的设置及存放位置, 第三方统计工具一般很难获取。

获取用户信息的途径

通过以上的方法实现用户身份的唯一标识后,我们可以通过一些途径来采集用户的基础信息、特征信息及行为信息,然后为每位用户建立起详细的Profile:

1) 用户注册时填写的用户注册信息及基本资料;

2) 从网站日志中得到的用户浏览行为数据;

3) 从数据库中获取的用户网站业务应用数据;

4) 基于用户历史数据的推导和预测;

5) 通过直接联系用户或者用户调研的途径获得的用户数据;

6) 有第三方服务机构提供的用户数据。

转载于:https://my.oschina.net/u/933928/blog/744443

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_736473.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

《网站建设与网页设计从入门到精通Dreamweaver+Flash+Photoshop+HTML+CSS+JavaScript》——3.5 设置头信息...

本节书摘来自异步社区《网站建设与网页设计从入门到精通DreamweaverFlashPhotoshop+HTMLCSSJavaScript》一书中的第3章,第3.5节,作者: 何新起 更多章节内容可以访问云栖社区“异步社区”公众号查看。 3.5 设置头信息 网站建设与网…

护卫神支持java_护卫神·网站运行环境配置

通过人工方式安装IIS或者是APACHE、FTP、ASP、ASP.net、PHP、SQL Server、MySQL、PhpMyAdmin、Zend、URLREWRITE伪静态、主机管理系统等运行网站必备的环境。服务内容:一、安装:IIS、ASP、PHP、ASP.net、FTP、SQL Server、MySQL、PhpMyadmin、Rewrite伪静…

python编程游戏用什么软件好,强烈推荐!4个 Python 的编程游戏网站,你知道不?...

编辑:Python编程时光学习编程虽然对有些人来说是件乐事,但是对大多数人来说仍然是一件比较枯燥困难的事情。当然,面临这样困惑的人并不是你一个。于是就出现了许多通过游戏来教你编程的平台,寓教于乐,让你快乐学习编程…

【译】一个值得所有前端开发者关注的网站: js.org

二十年后,域js.org第一次注册,它终于服务于其明显的目的 - JavaScript社区。 从一开始,对JavaScript的看法各不相同 - 有些人喜欢的语言,有人讨厌它。但是,对于使JavaScript成为最受欢迎的编程语言之一的社区的威力&am…

网站php cgi.exe 太多,如何解决php cgi.exe 太多的问题

如何解决php cgi.exe 太多的问题php cgi.exe太多的解决办法:首先检查系统盘空间;然后将PHP安装为CGI模式或者ISAPI模式;接着修改程序;最后在web服务器配置中优化fastcgi配置文件参数即可。推荐:《PHP视频教程》服务器大…

linux 回滚之前的版本,Git版本回滚_Linux教程_Linux公社-Linux系统门户网站

先说今天遇到的问题,看到一个config.php的配置文件一直在修改的状态下,但是和远程的config.php是不一致的,我不需要提交它,但是看它在 modified的状态下,很不爽,想删除它,git rm config.php&a…

php mysql购物网站作业_购物网站的设计与实现(PHP,MySQL)(含录像)

购物网站的设计与实现(PHP,MySQL)(含录像)(毕业论文10000字,程序代码,MySQL数据库)本项目是通过B/S框架技术来进行设计和实现的。项目主要用到的技术有php,phpscript,html/css等。数据库使用的是MySQL。购物网站共分为两个部分,一部分是面向用…

谈一谈|个人博客网站开发记录一

欢迎点击「算法与编程之美」↑关注我们!本文首发于微信公众号:"算法与编程之美",欢迎关注,及时了解更多此系列文章。欢迎加入团队圈子!与作者面对面!直接点击!前言因为疫情原因&#…

谈一谈|个人博客网站开发记录二

欢迎点击「算法与编程之美」↑关注我们!本文首发于微信公众号:"算法与编程之美",欢迎关注,及时了解更多此系列文章。欢迎加入团队圈子!与作者面对面!直接点击!前言在上周进行整体介绍…

个人博客网站开发记录三(难点技术分析)

之前两篇文章简述了项目的大致架构,这篇文章不再逐步讲解简单的细节和代码,主要分析个人博客网站中较难的技术点,也是该系列的最后一篇。 问题 在搭建网站的过程中碰到的较难的部分便是文章的上传。因为以前写了很多文章,但都是wo…

小米集团王嵋因错误表达致歉并请辞;亚马逊云服务出现中断,许多网站受到影响;deepin 深度系统更新发布

整理 | 郑丽媛头图 | CSDN 下载自东方 ICCSDN高校俱乐部的读者朋友们下午好哇,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 一分钟速览新闻点! 微信:今年已对超过620 万个恶意注册违规帐号进行处理 对标 Mac mini,联想正…

python基于urllib与http访问关键词网站

urllib。request是http.client的抽象,要访问网站,可以使用urllib.request.urlopen(),只需要一行代码. 实验原理 用urlencode()对于搜索的关键字进行url编码,然后拼接到百度的网址后,应用urlopen()发出请求并取得结果&#xff0c…

SEO独家揭秘:政府高权重锚文本虚拟外链技术!

最近不少人都在问怎么做外链,其实外链严格来说有两种,一种用于投票,一种用于单纯的吸引蜘蛛抓取。虽然外链的作用的本质还有一种,就是引流,但是大多数情况下不现实,除非是一些导航网站才有可能做到这些真正…

一个可以在线编写matlab的网站,你了解吗?

在线编写matlab,脱离自己的电脑,让一些更高深的算法在最新的版本下得到支持是我们的理想化状态,matlab官网提供了这一个区域,可以在线编写,网址如下: 链接传送门 博主打开效果图 希望能帮助到大家&#xf…

谈一谈|如何5分钟上手,快速搭建网站?

欢迎点击「算法与编程之美」↑关注我们!本文首发于微信公众号:"算法与编程之美",欢迎关注,及时了解更多此系列文章。欢迎加入团队圈子!与作者面对面!直接点击!前言当下很多网站开发者…

免费学编程!10个全球顶尖的编程在线自学网站

编者按:现在会编程的设计师越来越多了,想跟上时代的同学,来看今天推荐的这10个网站,不仅有大量免费的编程语言课程,还有很多实战项目供你练习。更重要的是,它的教学方式都是针对零基础的,很容易…

想知道怎么月薪3000涨到10000的秘密吗?为你推荐6个绝佳网站,坚持一个月

有人说,会搜索才叫会上网,搜索引擎在我们日常生活中的地位已是举足轻重。要想在浩如烟海的互联网信息中找到自己所需的信息,都需要一点点技巧。 看了一下自己收藏夹里面的几百个网站,每次找都要找半天,特别浪费时间。…

SEO内部链接优化,8个小技巧,或许你经常忽略!

对于站内优化,我们首要考虑的就是链接,那么哪种类型的链接在SEO中更有价值呢? 位置:首页、导航、页脚、内容链接! 类型:锚文本、文本链接、图像链接! 对于这些链接,在站内优化中&…

简单的小说网站爬虫--爬小说

现在好多的小说网站只提供阅读,并不提供下载服务,既然能够读,可以在网页上看,那么小说内容一定在网页的源代码中 用浏览器,右键,查看元素,查看网页源代码,以及代码结构(火…

网站导航设计指南

以下内容由Mockplus团队翻译整理,仅供学习交流,Mockplus是更快更简单的原型设计工具 “如果人们在浏览网站时遇到困难,他们就会犹豫是否要回到该网站。” 你以前可能经历过类似的情况,如果你下载了一个app,却要花时间去…