点击“我不是机器人”后，网站到底怎么知道你真的是人？

点击“我不是机器人”后，网站到底怎么知道你真的是人？

news/2024/5/20 13:20:24/文章来源:https://blog.csdn.net/weixin_39787242/article/details/114632841

本文转载自腾讯网，大部分人可能都被Google要求做过这样奇怪的保证：

“我不是机器人”。

只要你经常使用一些国外的网站，它就会隔三差五地弹出这个对话框，要求你点击来“声明”自己不是机器人。

以前这种“证明自己是人”的环节里，有很多让人不胜其烦的验证码，要么是一串扭曲的字符，要么是一堆支离破碎的图片让你辨认。但在这种最新的验证下，大部分情况下，只要你点击确认之后，网页就会成功放行。

这显然是一种更方便快捷的验证形式。但它同时也让一些用户陷入了迷惑：

“这究竟怎么判断我到底是不是机器人的？”

“难道是因为机器人不会撒谎？”

事实当然并非如此。

简单的点击背后，其实暗藏着很多信息传递，甚至包含你的隐私的暴露……

这个你已经可能见怪不怪的机器人测试背后，掩盖着的是十数年人机对抗的斗争史。

点击“我不是机器人”这一交互形式，本质上来说还是你在填验证码。

要解释这一点，我们就有必要回顾一下验证码的发展历程。

对于现在的用户而言，填写各类验证码已经必不可缺的技能之一。验证码只会耽误每位用户几秒钟的时间，但却能极大提升网络环境的“清净程度”。

如果没有它的存在，那你现在恐怕会遭受更多的垃圾邮件轰炸，信息骚扰。服务商也会面对泱泱脚本大军而感到崩溃……

就像20年前的互联网那样。

2000年之前，验证码并不存在。那时的网络虽然并不发达，但已开始兴起，各类论坛和邮件服务商的涌现，拉开了网络交流时代的序幕，而与正向技术一同出现，当然还有种种恶意脚本。

垃圾邮件、评论、恶意信息随着脚本的出现开始漫天飞舞。雅虎作为2000年左右最为出名的网络服务商之一，深受其害——他们是互联网早期最重要的免费邮箱提供商，但面对脚本和海量垃圾邮件束手无策。于是雅虎便联系到了卡内基梅隆大学的计算机科学系来寻求帮助。

雅虎的主要需求是想“有效分清真人用户和机器脚本”。卡内基梅隆大学一名21岁的学生路易斯·冯·安恩（Luis Von Ahn）针对这个目的有了思路：要让注册的用户提供“证据”来证明自己是一个人类，例如做一些只有人类能做，而机器做不到的事情。

什么事情是在当时只有人类能做而机器做不到的？答案是阅读图片。

人类可以很轻松的读出图片中的信息，但当时的机器并没有这样的能力。如果通过程序来提供一些稍加扭曲的图片，然后让注册者回答图片中的内容，便能很轻易地将机器拒之门外。

听起来是不是很熟悉？这正是即使在现在我们也很常看到的验证码形式之一。

2000年左右，这名学生路易斯·冯·安恩发明了验证码这一概念，他将其命名为CAPTCHA。

CAPTCHA是Completely Automated Public Turing test to tell Computers and Humans Apart的简写，意为“全自动区分计算机和人类的图灵测试”。

也是从这一刻开始，一场持续数十年的，人与机器之间，围绕着图灵测试的对抗开始了。

说起这种最早出现，也是最常见的验证码形式，恐怕大多数人，都对它有过一些不太美好的回忆。

最早出现的验证码，都是一些简单容易看懂的形式。人类可以很简单地分清上面的内容。

但随着机器识别图片能力的提高，验证码的难度也日益提升。

有时它的难度甚至大到网友怀疑自己的程度。

为了避免被机器识别，验证码需要对图上的文字加以扭曲等视觉干扰，本质上是为了避免被机器认出来。

但有时扭曲的程度也难到了人类。

“U”和“V”像是双胞胎兄弟，“O”和“0”很难分清，这基本上是每个网友都碰见过的麻烦。但这些都只是初级问题，当中文验证码出现之后，人们面前的困难也就更多了，和英文、数字验证码不同的是，中文验证码更多是给人心理上的折磨。

2017年，成都大学的一名大四女生，在网上准备报名考研。输完用户和密码后，她的屏幕上弹出两个字的中文验证码：

“别考”

后官方表明“纯属巧合”

关于这种初级形态的验证码，类似的问题无时无刻在困扰着网民们。而验证码又对网络环境而言来说是个不可或缺的存在。

每位网民都要在验证码上花费几秒时间，看似成本短暂，但叠加起来又是一个巨大的量级。

根据统计数据，全球网民每天需要输入近2亿次验证码，每次需要花费十秒。算起来，全人类每天会在验证码上花费50万个小时。

验证码最初的发明者，路易斯·冯·安恩发现这个事实后，深感浪费——毕竟时间就是金钱。而这50万小时的资源，就这样白白浪费掉了。

他现在是多邻国的创始人

有什么能利用这些时间的方法吗？路易斯·冯·安恩又有了想法：既然验证码需要让人类辨认图上的文字，那能不能让人类“顺带”帮忙辨认一下一些难以识别的书籍？

这听起来似乎是天方夜谭，但路易斯·冯·安恩通过一个简单的小方法实现了。

他把验证码需要输入的单词改为两个，其中一个是已知答案的单词，另一个是摘自旧书或手稿中的单词。

已知答案的单词是单纯的验证码，如果用户成功输入，那就已经通过了测试。

于此同时，这也意味着这名用户不是瞎打的字。那么用户所辨认的另一个截取自古书籍的单词的内容，也将被记录为有效答案。如果有3位用户对一个单词给出同样的答案，那么该字就将得到校验。

你看似是在输入验证码，其实是在帮助翻译古书籍上的内容。

这个新的验证码机制（reCaptcha）很快被各大网站利用，随后被谷歌收购。每天大约有4000万个单词就这样被辨认出来，这个新的验证码系统，靠着无穷无尽的免费人力资源，每年能读出数十万本书。

这是验证码大战的另一次升级：人类创造脚本来牟利，脚本让人类在验证码上浪费无数时间成本，而聪明的人类又把这份成本有效的利用了。

当然，这并不意味着这场斗争的停止。

看图识字型验证码，仅仅维持了一段时间的互联网和平。验证码农场的诞生，开始带来一些改变。

所谓验证码农场，就是一些专门来人工识别验证码的工作室。它的原理非常简单：“农场主”雇佣大量廉价人力资源，这些人坐在电脑前，无间断地输入从各地发来的需要辨认的验证码。

这种质朴的方式的确扰乱了大环境，但带来的改变并没有那么致命。

真正的变化，还是起于机器识别能力的日益提升。随着技术逐步升级，原本对于机器来说难以辨认的扭曲验证码，已经不再是一个天大的难题。

在2014年，谷歌发布新的研究成果，一个专门用来解读扭曲验证码内容的算法。

最后测试的结果中，机器解读验证码成功率99.8%，而人类的成功率，是33%。

在绝对的技术面前，人力再一次落败。但这当然不是验证码的陌路。

2014年，Google发布了新一代验证码技术，他们将其称为：“No CAPTCHA reCAPTCHA ”——“没有验证码的验证码”。

这个没有验证码的验证码十分简单，只需要你勾选一个按钮，来“证明”自己不是机器人。

这就是如今我们常常看见的“我不是机器人”。

“我不是机器人”看起来简单方便，只需用户轻轻一点。但背后的逻辑要比普通验证码复杂许多。

当你点击“我不是机器人”时，Google将会分析你的各种行为，包括点验证码前、点验证码时、点验证码后的动作，来判断你是不是人类。

它也会收集一些你的数据，比如指针移动速率，当前IP，是否使用插件，页面使用时间，进行过多少次点击……

如果你展现出来的行为，都符合一个人类的标准，那网页就会放行。

基本上可以这样说：这是用一小部分隐私换来的快捷。

而且有意思的是，这种测试对于真正的（物理）机器人来说反倒不太有效。

当然，有时Google也无法单纯从你的行为来确认你是否为人类，而这时就会出现图片测试，要求用户选择图片中出现的XX。

这种也是当下比较常见的一种验证码形式，同时也遭人吐槽最多。

比如说，图片测试中要求辨认的物体，总是很刚好地超出选项框一点点，令人左右为难。

“选出图片中的汽车”往往是最难的一项。

选交通信号灯也常常让用户感到无从下手。

有时图片里根本不会有要求辨认的物体：

基本上每个网民，都曾被这种类型的验证码折磨过几回。也让“选出图片中的xx”顺利成为了一种梗图。

如果你有幸曾在12306上购买过车票，应该也能理解这种痛苦。自2015年开始，12306上线了新的图片验证码，自此让所有买票人叫苦连天。

据官方统计，能一次性输入对12306验证码，只有8%。

脚本越来越厉害，验证码越变越复杂，这似乎是一个无解的循环……

由人们创造的，日益提升的机器算法，和同样出自于人类之手的脚本相互抗衡，最终诞生的时间成本，似乎还是要人类自己来承担。

最近这两年，Google又推出了新一代验证码 reCaptcha v3。

而reCaptcha v3，其实也不用再被称之为“验证码”了，因为它并不需要用户做出任何证据来“证明”自己是个人类。

它会在网站后台自动记录使用者在网站中浏览的行为特征，随后根据这些记录来给用户打分，当用户的“非人”操作足够多之后，就会被判定为机器人。

这项技术如今并没有被大面积使用。但对验证码的发展来说，似乎是个较好的方向。但它必然也是有代价的，比如隐私……

截至目前来看，这场人与机器之间，围绕着图灵测试的对抗，仍未有个明确的局势。

或许在技术更加发达的未来，如何证明自己是个人类，对于人类而言将变成更难的一个问题。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.luyixian.cn/news_show_770906.aspx

如若内容造成侵权/违法违规/事实不符，请联系dt猫网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

帮年轻人 “规划身后事”，这家网站获千万融资

帮年轻人 “规划身后事”，这家网站获千万融资

本文转载自IT之家，2020 年 4 月的一天，24 岁的伊莎贝尔撰写了一条未来她将从坟墓中发来的推文。她并没有即将就要逝去，甚至也根本没有生病。伊莎贝尔被一种新的互联网服务「种草」了。她在网上看到了一些帮助人们「规划身后事」的网站&…

阅读更多...

底层小程序员练手做一个网站不小心赚了几十亿

底层小程序员练手做一个网站不小心赚了几十亿

微信又改版了，为了方便第一时间看到我们的推送，请按照下列操作，设置“置顶”：点击上方蓝色字体“程序员之家”-点击右上角“…”-点击“设为星标”。可以啦，让我们继续相互陪伴。人们都说互联网是个神奇的领域&#xf…

阅读更多...

8个程序员专用软件/网站，个个是神器，第一个最惊喜......

8个程序员专用软件/网站，个个是神器，第一个最惊喜......

微信又改版了，为了方便第一时间看到我们的推送，请按照下列操作，设置“置顶”：点击上方蓝色字体“程序员之家”-点击右上角“…”-点击“设为星标”。可以啦，让我们继续相互陪伴。节省时间的方法有俩，一个是…

阅读更多...

相亲网站男生都是一个人，单身程序员惊现神操作！！

相亲网站男生都是一个人，单身程序员惊现神操作！！

微信又改版了，为了方便第一时间看到我们的推送，请按照下列操作，设置“置顶”：点击上方蓝色字体“程序员之家”-点击右上角“…”-点击“设为星标”。可以啦，让我们继续相互陪伴。话说，今年还有不到一个月就…

阅读更多...

为网站引入今日诗词

为网站引入今日诗词

今日诗词 API 是一个可以返回一句古诗词名句的接口。它可以通过图片和 JSON 格式调用。今日诗词 API 根据不同地点、时间、节日、季节、天气、景观、城市进行智能推荐。官网：www.jinrishici.com <div id"poem_info"></div> <div id"…

阅读更多...

搜免费电子书，怎么能少了这些网站！

搜免费电子书，怎么能少了这些网站！

链接：https://www.lifewire.com/download-free-books-3482754作为开发者多看点书还是应该的，要是想要看的书都能免费那就更好不过了，此前猿哥已经和大家分享过一些免费电子书（下载/在线）阅读网站：程序员专属…

阅读更多...

Fastly道歉：软件漏洞导致全球大量网站宕机

Fastly道歉：软件漏洞导致全球大量网站宕机

本文转载自IT之家北京时间 6 月 9 日下午消息，据报道，云服务提供商 Fastly 今日表示，导致昨日大量网站宕机的罪魁祸首是一个软件漏洞（Bug），该漏洞由一家客户更改其设置后触发。昨晚，全球大量…

阅读更多...

黑客捣毁了个暗网杀手网站，却险些触发了世界各地的多起杀戮...

黑客捣毁了个暗网杀手网站，却险些触发了世界各地的多起杀戮...

来源：https://mp.weixin.qq.com/s/qcQ4WDuBKy0ZbAn0G66zg几年前，伦敦的业余黑客Monteiro突然收到了一封邮件，邮件是一行粗体字：“自杀（还是谋杀）？”，邮件下面附了一个链接&#xff0…

阅读更多...

Python爬取网站图片数据

Python爬取网站图片数据

Python爬取网站图片数据找到需要爬取的网站地址模拟网站http请求根据调试模式获取的了解读取到真实的地址url，读取请求头数据和参数信息，模拟http请求调用 import requests from urllib.parse import urlencode # requests内置的状态码&#xff0c…

阅读更多...

这个项目把100多个知名网站都克隆出来了！

这个项目把100多个知名网站都克隆出来了！

本文转载自GitHub技术社区今天要和大家推荐的这个开源项目牛逼了，把100多个热门网站都克隆出来了，还将源码通通开源，Airbnb，Amazon，Instagram，Netflix，Tiktok，Spotify，…

阅读更多...

Python爬虫进阶之JS逆向某视频网站登录

Python爬虫进阶之JS逆向某视频网站登录

很久没更新JS逆向方面的文章了，一个原因是因为最近爬虫这方面管的比较严，相信大家都看过很多违法的案例了，就不细说了。另一个原因是我换坑了，现在的工作内容基本上和爬虫不相关了。不过大家请放心这方面的内容会持续慢慢…更新下去，当然还有web这方面的内容以及Python其…

阅读更多...

Python爬虫进阶之某支付网站密码分析

Python爬虫进阶之某支付网站密码分析

目标网站 aHR0cHM6Ly9hdXRoLmFsaXBheS5jb20vbG9naW4vaW5kZXguaHRt 今日目标网站是我们常用的支付网站，感觉自己有点飘了~~ 这里只解密密码的加密方式，至于其他参数… 请求分析先看请求，输入账号，密码后点击登录，记得提前浏览器打开 F12 这里注意输入错误的密码，方…

阅读更多...

完成图书管理系统类图的绘制_智慧图书馆管理系统方案/APP/小程序/公众号/网站...

完成图书管理系统类图的绘制_智慧图书馆管理系统方案/APP/小程序/公众号/网站...

随着人们对图书需求的不断增加，以及图书馆数量的不断增加，传统的完全靠人工管理的图书馆已经难以适应时代发展的需求。传统的图书馆存在图书管理模式落后，找书困难，借还手续繁琐。图书资源有限，无法提高图书的流通率和…

阅读更多...

wp网站想换个服务器怎么弄,wordpress服务器搬家和更换域名的几个步骤

wp网站想换个服务器怎么弄,wordpress服务器搬家和更换域名的几个步骤

问题解说其实wordpress换域名需要到数据库进行操作的，首先，你换域名也是有几种情况的；换空间换域名如果是上述问题，那么将FTP整站打包外，还需要将数据库里的所有数据表也打包，数据库是进phpmyadmin里打包的…

阅读更多...

服务器医疗网站,云服务器医疗

服务器医疗网站,云服务器医疗

云服务器医疗内容精选换一换云服务器组是对云服务器的一种逻辑划分，云服务器组中的弹性云服务器遵从同一策略。当前仅支持反亲和性，即同一云服务器组中的弹性云服务器分散地创建在不同的主机上，提高业务的可靠性。您可以使用云服务器组将业…

阅读更多...

两行代码实现精简的网站访问量统计（不蒜子）

两行代码实现精简的网站访问量统计（不蒜子）

一、不蒜子简介 “静态网站建站现在有很多快速的技术和平台，但静态是优点也有缺点，由于是静态的，一些动态的内容如评论、计数等等模块就需要借助外来平台，评论有“多说”，计数有“不蒜”！（多说…

阅读更多...

Chrome 插件下载网站+6个实用插件推荐

Chrome 插件下载网站+6个实用插件推荐

一、Chrome插件下载网站 1.https://crxdl.com/ 可以下载Chrome扩展插件CRX离线安装包直接在搜索框输入想要下载的插件名或关键词即可搜索到相关插件，然后点击下载即可，该网站无广告，搜索速度快，下载速度快，全程操作丝…

阅读更多...

基于大数据的网站日志分析系统

基于大数据的网站日志分析系统

本文没有任何代码，只有各个模块工作的大体机制和整体流程。算是一个科普文吧，我也对原理一知半解。基于大数据的网站日志分析系统1. 日志数据格式1.1 访问日志1.1.1 log_format1.1.2 access_log1.2 错误日志2. 数据采集模块2.1 Flume的运行机制3. 数据存…

阅读更多...

网站总是请求访问index.js.map，为什么会这样？

网站总是请求访问index.js.map，为什么会这样？

网站总是请求访问index.js.map，为什么会这样？程序中并没有此链接呀！

阅读更多...

如何在Ubuntu中屏蔽一个网站

如何在Ubuntu中屏蔽一个网站

在本教程中我将教你如何通过编辑/etc/hosts文件来屏蔽在Ubuntu Linux上不受欢迎的网站，这是用来处理DNS和Linux网络的系统文件。我很喜欢这种方法，因为我不需要依靠第三方应用程序，这是非常容易使用的。您需要做的就是在/etc/hosts文件文件…

阅读更多...

推荐文章

最新文章