mib browser 怎么获取目标cpu_百度快排探究(一),Python selenium 实现自然搜索访问目标网站...

news/2024/5/20 12:28:45/文章来源:https://blog.csdn.net/weixin_39532466/article/details/111709831

快排是现在比较火热的seo手段,快排即快速排名,相比传统的优化手段,尤其是企业站而言,快排能够快速占据排名,获取流量及客户,也是最热门的韭菜项目,可谓酸爽至极。

快排有没有用,据观察,应该是有用的,不管是从百度专利算法,还是从百度搜索上的排名体现,都能够看到快排的效果,而本渣渣也关注过不少匪夷所思的网站排名,很难说服自己这不是快排的身影效果。

1cc1315a7c2db3bbd5032a9779b0f747.png

首先声明:

第一:市面上确实有很多快排,至于效果,试过才知道,大部分应该都是智商税;第二:本渣渣不会快排,也没有用过快排;第三:本渣渣在尝试探究快排,至于能否实现,还是一个未知数,欢迎一起探讨交流。

还处于探索研究期,有进度会第一时间总结,分享,大概会出一个系列的探索吧,原创不易,点个在看,关注吧!

手里头有一两份快排源码,参考着探索了一下快排,通过Python selenium 实现了自然搜索访问目标网站,已经在百度统计中获取到访问信息。

感兴趣的大佬哥,欢迎交流分享!

Python selenium 环境配置

  1. python3 安装

官网下载python3安装包,选定路径安装并配置环境变量,可自行百度 相关安装教程。

  1. selenium 安装 通过 python pip 安装即可
pip install selenium
  1. 浏览器驱动安装

本渣渣这里使用的是谷歌浏览器,所以安装的 chromedriver 驱动。

关键点

1.百度搜索翻页

遇到的问题,当翻页到第三页的时候,死活翻不过去,一直在第一页以及第二页循环。

    #百度搜索结果翻页
    def get_nextpage(self):
        self.browser.find_element_by_xpath("//div[@id='page']/div[@class='page-inner']/a[@class='n']").click()
        time.sleep(8)

思考

应该是定位翻页元素丢失,同时结合百度搜索相关问题,找到相关内容。

解决方案

另一个翻页版本

   #百度搜索结果翻页第三页
    def get_newnextpage(self,i):
        self.browser.find_element_by_xpath(f"//div[@id='page']/div[@class='page-inner']/a[{i}]").click()
        time.sleep(8)

2.百度搜索网址转码

把搜索结果的网址转化为正常的网页地址。

获取定位元素,使用get_attribute方法。

    #解密匹配网站
    def get_trueurl(self,searchurl,siteurl):
            search_url=searchurl.get_attribute('href')
            #print(search_url)
            # 解密url
            resulturl = requests.head(search_url).headers['location']
            print(resulturl)

3.找到目标网址,并访问

匹配搜索结果的网页地址,直接用 in 即可,这里需要注意的是,访问目标网址的方式,以网址的访问形式是无法统计到自然流量当中的,只能算是直接访问。

    def get_urlchilk(self,searchurl,resulturl,siteurl):
        if siteurl in resulturl:
            print("找到目标网站,开始访问网站..")
            searchurl.click()
            time.sleep(2)

4.一个莫名的错误,待解决中

出现过一两次的错误,如果解决不了,考虑使用 try/except 来跳过这样的错误内容!Selenium中错误:selenium.common.exceptions.ElementClickInterceptedException: Message: element click inte

5.翻页实现

渣渣就是渣渣,使用了笨方法,完成了百度搜索结果前十页,也就是前百名的搜索。

    def main(self,keyword,siteurl):
        self.get_search(keyword)

        print("正在查询第1页搜索结果..")
        self.get_searchurls(siteurl)

        print("正在查询第2页搜索结果..")
        self.get_nextpage()
        self.get_searchurls(siteurl)

        print("正在查询第3页搜索结果..")
        self.get_newnextpage(3)
        self.get_searchurls(siteurl)

        print("正在查询第4页搜索结果..")
        self.get_newnextpage(4)
        self.get_searchurls(siteurl)

        print("正在查询第5页搜索结果..")
        self.get_newnextpage(5)
        self.get_searchurls(siteurl)

        print("正在查询第6页搜索结果..")
        self.get_newnextpage(6)
        self.get_searchurls(siteurl)

        print("正在查询第7页搜索结果..")
        self.get_newnextpage(7)
        self.get_searchurls(siteurl)

        print("正在查询第8页搜索结果..")
        self.get_newnextpage(7)
        self.get_searchurls(siteurl)

        print("正在查询第9页搜索结果..")
        self.get_newnextpage(7)
        self.get_searchurls(siteurl)

        print("正在查询第10页搜索结果..")
        self.get_newnextpage(7)
        self.get_searchurls(siteurl)


当然代码精简和优化的很大余地,或者考虑换一个方式来实现?

以上,实现了百度搜索结果前十页,也就是前100名的搜索提交,可实现自然流量的访问记录,以关键词的自然搜索方式来进入到目标网站当中,百度统计中可以看到访问来路。

总结和思考

  1. 如果你的人为模拟够给力,刷百度竞价应该可以实现,不知道百度对于竞价过滤的方式是如何,不过考虑到点的越多,消费越多,百度的力度是否有多大呢,那些真正可以实现快排的,应该可以刷竞价吧!

  2. 如果模拟人为搜索,相关参数,以及设置,需要如何模仿,以达到符合用户搜索的行为呢,这都需要下一步的测试,包括,设备,cookies,以及大部分人所说的ip!

参考来源:

分享百度快排发包python源码核心文件

https://www.52pojie.cn/thread-1035569-1-1.html

selenium之百度搜索,结果列表翻页查询

https://www.cnblogs.com/shouke/p/10158134.html

Selenium中错误:selenium.common.exceptions.ElementClickInterceptedException: Message: element click inte

https://blog.csdn.net/please_fix_/article/details/104949016

a79c8a9984e8c99fcb6ca65fe9bbb8b1.png      

微信公众号:二爷记

不定时分享python源码及工具

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_810857.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

围巾网站css模板,用纯css3和HTML5写出戴花围巾吃柠檬味棒棒糖的企鹅

用纯css3圆角边框和HTML5写出戴花围巾吃柠檬味棒棒糖的企鹅,插入一些小动画,更加活灵活现,好萌。css样式html,body,div,strong{margin: 0;padding: 0;}.all{width: 1000px;height: 1000px;}.all1{width: 800px;height: 600px;margin:0 auto;p…

服务器和网站域名,网站服务器和域名的区别

网站服务器和域名的区别 内容精选换一换华为云漏洞扫描服务帮助中心,为用户提供产品简介、用户指南、最佳实践、常见问题、视频帮助等技术文档,帮助您快速上手使用漏洞扫描服务。目前,华为云SSL证书管理服务提供了OV(企业版)、OV Pro(企业型专…

IE打开网站大部分都没背景的问题

早上接到保修,说IE打开某某供货平台后页面为空白,什么都不显示,过去看了,发现有鼠标可以找到输入框,输入用户名和密码后可以登录平台,登录进去可以看到文字,但背景全是白色的,试了其…

html标签命令与大小写有关吗,做SEO时,需要了解哪些HTML标签 ?

HTML标签是什么HTML,全称Hypertext Markup Language,也就是“超文本链接标示语言”。HTML文本是由 HTML命令组成的描述性文本,HTML 命令可以说明文字、 图形、动画、声音、表格、链接等, 即平常上网所看到的的网页。设计 HTML 语言…

windows2003 构建SSL网站

实验之前,说说公钥基础结构(PKI),它是使用公钥技术和数字证书来确保系统信息安全并负责验证数字证书持有者的身份的一种体系PKI由4部分构成,公钥加密技术、数字证书、CA(证书颁发机构)、RA&…

服务器系统保留分区,win10体系保存分区有什么用?_网站服务器运转保护

win10体系保留分区的作用:保留分区用于寄存启动文件以及预留给BitLocker驱动器加密,这不仅节省了设置BitLocker驱动器的时刻,同时减少了用户今后要测试的时刻。还能够:隐蔽分区的状况,隐蔽分区中的内容,增加…

html h1h2怎么缩短距离,H1、H2标签怎么使用才能有利于SEO优化?

做seo优化工作难免碰到奇葩的网站,H1、H2标签到处乱用,面对这个我们就要去有效的优化H1、H2标签,小编为大家介绍一下H1、H2标签怎么使用才能有利于SEO优化?通常,一个页面只能有一个H1,且首页的H1一般是网站的主关键词…

分享8个帮助你学习快速编程的实用网站

日期:2012/02/20 来源:GBin1.com 作为一个合格的前端开发人员,我们不得不学习很多最新的技术和实现,不论是html5,CSS,CSS3, javascript,还是后台的最新数据库技术nosql。如果你不能…

分享一个帮助你检测网站颜色对比度的在线web工具 - checkmycolours

为什么80%的码农都做不了架构师?>>> 日期:2012-6-18 来源:GBin1.com web或者网站设计中很重要的一点在于如何有效的使用颜色搭配,可能大家都有过痛苦的上网浏览体验,因为很多网站都没有很好的处理颜色对比…

由12306.cn引发的网站性能技术思考

2019独角兽企业重金招聘Python工程师标准>>> 12306.cn网站挂了,被全国人民骂了。我这两天也在思考这个事,我想以这个事来粗略地和大家讨论一下网站性能的问题。因为仓促,而且完全基于本人有限的经验和了解。只讨论性能问题&#x…

网站制作工具简介_洛阳新闻网站建设工具,沈闻网站建设制作

成都御天程为您详细解读KUywim洛阳新闻网站建设工具的相关知识与详情,企业网站建立是为了更好的正在互联网时代开展,不管是自助/模板建站,还是个性化需求定造建站,也都需要考虑适应时代的开展。网站总是为企业效劳的,换…

帮助你更快的进行网站设计 - Markup Framework

为什么80%的码农都做不了架构师?>>> 日期:2013-4-30 来源:GBin1.com Markup是一套布局,小组件,UI组件和字体排版样式的框架,可以帮助你快速的执行web相关的设计和开发,相信没有人…

推荐几个细胞注释网站

细胞注释是单细胞分析中很关键的环节,初期会比较痛苦,做多了才会悟出一些规律。 我公众号早期写过几篇细胞注释相关的帖子: 单细胞分析实录(7): 差异表达分析/细胞类型注释SingleR如何使用自定义的参考集除了写代码,我其实也用过三…

博客网站项目的开发

一、网站开发的过程: 1 需求分析:主要进行目标的定位:了解网站的主要职能以及网站的用户对象; 2 平台规划2.1 内容规划:主要弄清楚该网站的主要职能以及所包括的模块 2.2 界面规划:该部分主要进行…

让网站打开速度更快技巧:开启gzip和deflate压缩

老鸟请直接看开启压缩进阶篇。菜鸟还是慢慢随着老夫的思路看吧,哇哈哈。什么是压缩? 1大家还记得我们第一次接触winzip软件吗?非常神奇,一个文件,经过winzip压缩后,大小可以压缩成原来的30%左右。记得当年…

浅谈千万级PV/IP规模高性能高并发网站架构

文章架构简图: 高并发访问的核心原则其实就一句话“把所有的用户访问请求都尽量往前推”。 如果把来访用户比作来犯的"敌人",我们一定要把他们挡在800里地以外,即不能让他们的请求一下打到我们的指挥部(指挥部就是数据…

网站开发规范

任何一个项目或者系统开发之前都需要定制一个开发约定和规则,这样有利于项目的整体风格统一、代码维护和扩展。由于Web项目开发的分散性、独立性、整合的交互性等,所以定制一套完整的约定和规则显得尤为重要。本文档将定制一系列约定和规则,他…

Coolite+Form网站后台身份验证

这个登录验证,coolite不是重点.重点是对网站进行Form方式的身份验证.对这块不太熟悉,查阅了一些资料.得以解决,分享出来!先来用coolite做个登录界面吧,既然用了coolite.<ext:ScriptManager runat"server"></ext:ScriptManager><ext:Window runat"…

vs2005 自带网站压力测试 (vsts)

VSTS提供了一个丰富、强大的工具平台&#xff0c;融合了软件开发领域的各个角色&#xff0c;涵盖软件开发生命周期的各个阶段&#xff0c;包括设计&#xff0c;开发&#xff0c;测试&#xff0c;管理&#xff0c;而这一整套构件的融会贯通&#xff0c;让它可以有效地改善软件开…

大型网站服务器架构

QQ游戏于前几日终于突破了百万人同时在线的关口&#xff0c;向着更为远大的目标迈进&#xff0c;这让其它众多传统的棋牌休闲游戏平台黯然失色&#xff0c;相比之下&#xff0c;联众似乎已经根本不是QQ的对手&#xff0c;因为QQ除了这100万的游戏在线人数外&#xff0c;它还拥有…