这是码迷SEO的第42篇原创
今天讲百度第三代点击排名统计系统,顺带把百度快排深度原理也刨析一下。
自从19年10月份以来,百度对快排打击丝毫没有手软的迹象,码迷发现凡是采集+快排模式的网站至今无一幸免,70多天了也没有起色的现象。
可以说百度这次对快排不是让你的快排失效,而是升级到惩罚性质了。
为了验证码迷的猜想,码迷特地搞了一套快排的源码,深入研究了一番。
无论是百度还是谷歌,算法一直在变,所以思路套路总有失效的时候。
没有任何算法是一成不变的,也没有任何算法是绝对停滞的。
但是百度在变与不变之间,它的理念、路线、战略,都依循用户体验这个原则上不断加以调适和修正。
百度与谷歌的不同
在了解点击统计排序系统之前,码迷还是那句老话,通过线上案例现象总结SEO规律,通过SEO规律探讨百度搜索算法本质,通过百度算法本质探讨正确有效的SEO策略。
我们以“SEO优化”、“SEO 优化” 两个搜索词(仅有一个空格之差)为例,看一下百度结果的差异。
如下图,虽然仅有一个空格之差,但是一半以上的搜索结果是不同的。
按照道理来讲,这两个词应该结果是一致的才对.
码迷对此也询问了百度的同学,百度猿也觉得自己算法垃圾的一批,码迷认为这是百度的BUG也不为过。
咱们再看看谷歌吧,如下图,可以看到谷歌给出的“SEO优化”、“SEO 优化” 两个搜索词的搜索结果,仅仅是广告而已,其他几乎完全一致哦。
“SEO优化”、“SEO 优化” 两个搜索词,刷“SEO优化”点击的非常多,但是刷“SEO 优化” 相对很少,这就导致了百度两个页面巨大的差异。
相对应谷歌,因为谷歌并不会把点击数据直接应用于排名计算,所以导致谷歌排序结果更加稳健一些,很难收到点击排名的影响。
在相同语义之下,百度与谷歌结果的差异,也说明了背后算法原理差异。
这个算法差异,就是点击,就是百度的点击统计系统。
一、百度点击排名系统的构成
百度点击系统,码迷认为更标准的说法为百度点击统计排序系统,主要有4部分组成,点击收集+点击统计+点击排序+点击反作弊,是一套非常完善的流水化作业系统。
首先,点击收集模块
百度点击收集,主要搜集搜索结果的点击次数,所述鼠标点击次数等于鼠标点击统一资源定位符URL次数加上鼠标点击文本次数。
也就是说,点击标题、点击描述摘要,都算点击。
其次,点击统计模块
百度点击统计什么,就是百度从数据库获取一段时间内的鼠标点击日志。
鼠标点击日志中包括用户标识、 点击的URL以及点击URL的时间,依据搜索结果的URL以及鼠标点击日志,统计搜索结果的鼠标点击URL次数;
其中,一段时间可以依据需求进行配置, 如一天、一周或一个月等。这里3个点非常重要。
重点1:用户标识
某高层论坛上,李彦宏也说了:“中国人更开放呀,愿意用隐私换效率呢”。
什么是用户标识,简单说就是用户类型、IP类型、终端类型。
百度对用户、IP、终端划分是非常细致的,不管你是临时用户还是注册用户,有时候单凭一个IP就知道你是谁了。
百度真的是这么干的。
现在市面上的快排系统,可以说99%的都是通过随机cookie生成的用户,在百度看来都是临时短期用户。
一个网站的用户全都是临时短期用户来的,百度信你个鬼啊。
重点2:周期性统计
另外一个重要的点是周期性统计,不知道大家注意到没有,之前1天刷100个点击,跟5天刷100个点击效果是一样的。
重点3:每次点击均有日志
你今天刷快排没有被百度识别,不代表明天百度就看不出来,因为你网站每一个点击都会硬邦邦的保存在百度日志系统中,而且日志只会归档,很少清空。
什么时候百度觉得你网站行为可疑,拿出历史旧账日志分析一番就可以了。
其次,点击反作弊模块
这块这一章节码迷在《码迷:谈谈百度对快速排名的打击手段》里面都已经详细说过了,核心专利是《CN201910352770.5 用于处理点击行为数据的方法和装置》,大家可以到码迷SEO的QQ群里面下载,码迷在这里不多描述。
码迷要说的是,快排反作弊系统是最近2019年年中刚上的系统,百度算法工程师确确实实下了一番功夫才研究出来的反快排点击系统。
但是,百度这个反作弊系统没有从根本上杜绝点击作弊,他本质是个后续二审算法而已。
主要有以下2个流程
流程1:点击数据聚类
网站刷快排点击之后,并不会被百度立马识别,而是在一定时间后(码迷认为一周左右),随着访问你网站的设备标识、用户访问路径与你网站URL通过机器学习,形成聚类之后。
流程2:作弊识别判定
你网站的用户行为形成的聚类,与百度已经训练好的多个“无作弊样本聚类”、“作弊样本聚类”做对比,如果命中了某个作弊聚类,你就玩完了。
最后,点击排序模块
点击排序,就是算各个搜索结果的权重值,百度也给出了公式哦。
不过一些人说看不懂就不想看了。
其实我还是建议大家认真看这个公式,我们只看因子就行了,内部算法细节不是最重要的哦。
你可以发现,点击得分与你鼠标的点击次数成正比,与全网整个关键词的点击次数成反比。
也就是你比竞争对手点的次数多,你的关键词点击率更高,那你的得分点击就更高。
那么现在如何做快速排名,有些同学刷快排得不偿失,主要有三个层面的原因。
【本文为SVIP专享文章,仅显示部分内容,升级为SVIP后可获取完整全文】
本篇首发于www.mamioo.com,同步发布于公众号”码迷SEO“。摩天楼为你排查SEO中原创内容无排名、关键词布局低质、网页主题不集中、相关词数量不足、相关词密度不均5大网页质量问题, 加码迷QQ群734299959可下载软件免费试用,了解更多。扩展阅读:码迷の摩天楼内容助手 用户案例---传统机械行业词上首页-摩天楼内容助手用户SEO案例分享---医疗美容SEO案例一枚新鲜出炉-摩天楼用户分享---纯白帽2000+指数词【冰箱排行榜】及相关词 佛系上首页---[SEO工具]PC和M端百度双首页-摩天楼内容助手10月实战SEO案例---SEO实战案例:[结婚礼物]指数300+新站45天排名第2-百度谷歌双首页---SEO实战案例-[生日礼物]1000+指数词50天上百度谷歌首页---从101名上首页第4名仅3天-SEO排名案例---3天排名从88名直接飙到首页第7名-摩天楼内容助手真实SEO案例整理---SEO干货:我是如何用纯白帽15天让百度流量增长500%的!---SEO实操案例揭秘-6天排名从20+提升到首页第8---指数词SEO排名上首页-真实SEO实战案例分享【9月汇总】---SEO降权站仅2天核心关键词排名恢复上首页-摩天楼内容助手用户真实案例扩展阅读:码迷の独家SEO内参系列---百度SEO内参-码迷SEO独家策略解读【导读】---码迷SEO独家内参(一)百度搜索引擎的工作原理及流程---码迷SEO独家内参(二)百度蜘蛛类型及蜘蛛抓取规律揭秘---码迷SEO独家内参(三)学会这四招爬虫抢着来---码迷SEO独家内参(四) 从附子SEO流量站套路到百度资源分配策略解析---码迷SEO独家内参(五) 从收录现象看百度对网页质量的判定级别(上)---码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利---码迷SEO独家内参(七) 探秘百度专利看百度对网页质量的评估方法(中)---码迷SEO独家内参(八) 从百度网页质量评估浅析个人怎么做流量站(下)---码迷独家SEO内参(九) 飓风算法3.0的前世今生及AI伪原创工具评测---码迷独家SEO内参(十) 相关性提权法&SEO文章质量提升方法[小白必读]---码迷SEO内参(11) 百度飓风3绝密算法解密及过百度原创的思路---码迷SEO内参(12) 如何做采集站:百度飓风3弱点&案例解析---码迷SEO内参(13) 快速排名系统野史,快排战度娘折腾3年之后又3年
---码迷SEO内参(14) 快排整站优化提权与百度资源平衡性策略点击左下方【阅读原文】可查看原网站文章