bootstrap下拉框选择没反应_SEO工具脚本,Python百度下拉框关键词采集工具

news/2024/5/10 7:05:28/文章来源:https://blog.csdn.net/weixin_29440125/article/details/112199492

对于词的研究,想必每个seoer都知道,而除了比较热门的百度相关搜索词之外,百度下拉框关键词应该也是不少人研究的范围,不过大部分人都是针对下拉框词的刷量,毕竟百度下拉框关键词采集已经泛滥成灾了。

百度下拉的官方正式叫法是百度推荐词(Baidu Suggest Word),民间又称之为百度联想词或百度下拉菜单。它是百度为了方便广大网民搜索,提高输入效率而推出的一项服务。

举例,当我们在百度输入“营销”这两个字的时候,百度就从推荐词条库中检索出以“营销”这两个字打头的词条,并根据搜索量从大到小排序,组建成下拉菜单。百度下拉菜单的最大数量为10条。

百度下拉框关键词的意义:

可以作为长尾词使用,作为标题使用,毕竟是用户搜索时候可以触发关键词搜索选择。

不少人将下拉词直接进行引流,比如曝光品牌,引导到指定的页面,你可以进行搜集分析竞争对手的相关操作,或者自己去曝光自己的品牌,见仁见智吧!

网络上留存有不少下拉词的采集工具和源码,这里,本渣渣早就已经整理过了,这里再次分享一下吧,昨晚有老哥问起,其实来来去去都是这些东西,没啥特别的吧!

版本一:

直接网页抓包实现下拉词的采集

2f0a2e0f784e9ceac806fb8ac0cc7adc.png
def get_keywords(word):url=f"https://www.baidu.com/sugrec?pre=1&ie=utf-8&json=1&prod=pc&wd={word}"html=requests.get(url)html=html.json()#print(html)#print(html['g'])key_words=[]for key_word in html['g']:print(key_word['q'])key_words.append(key_word['q'])#print(key_words)return key_words

版本二:

使用官方接口

比如:

https://sp0.baidu.com/5a1Fazu8AA54nxGko9WTAnF6hhy/su?wd=seo&sugmode=2&json=1&p=3&sid=1427_21091_21673_22581&req=2

168ef43a6615af394bf8f93c14362fc0.png
def get_sug(word):url = 'https://sp0.baidu.com/5a1Fazu8AA54nxGko9WTAnF6hhy/su?wd=%s&sugmode=2&json=1&p=3&sid=1427_21091_21673_22581&req=2&pbs=%%E5%%BF%%AB%%E6%%89%%8B&csor=2&pwd=%%E5%%BF%%AB%%E6%%89%%8B&cb=jQuery11020924966752020363_1498055470768&_=1498055470781' % wordr = requests.get(url, verify=False)  # 请求API接口,取消了HTTPS验证cont = r.content  # 获取返回的内容res = cont[41: -2].decode('gbk')  # 只取返回结果中json格式一段,并且解码为unicoderes_json = json.loads(res)  # json格式转换return res_json['s']  # 返回关键词列表

版本三:

另一个接口地址

e81dfe89690b1479cbf851e3c5a173d2.png
def get_word(word):url=f'http://suggestion.baidu.com/su?wd={word}&sugmode=3&json=1'html=requests.get(url).texthtml=html.replace("window.baidu.sug(",'')html = html.replace(")", '')html = html.replace(";", '')#print(html)html = json.loads(html)key_words=html['s']#print(key_words)return key_words

本质上二和三都是同一个性质,大家参照着看和用吧!

扩展版本:

这里有个小技巧,就是在关键词后面输入w,会出现跟拼音以w开头的一系列关键词,比如“黄山w”,会出现“黄山温泉”,”黄山玩几天“,“黄山五绝”等关键词(见上截图)。因此,当我们把a~z遍历一遍,会出现更多关键词。

def get_more_word(word):more_word=[]for i in 'abcdefghijklmnopqrstuvwxyz':more_word.extend(get_keywords('%s%s'%(word,i)))print(more_word)print(len(more_word))print(len(list(set(more_word))))return list(set(more_word))  #去重操作def get_more_sug(word):all_words = []for i in 'abcdefghijklmnopqrstuvwxyz':all_words += get_sug(word+i)  # 遍历字母表 | 利用了上一个函数print(len(list(set(all_words))))return list(set(all_words))  # 去

这里选用版本二的接口形式,避免被和谐

但是使用requests模块请求一个证书无效的网站的话会直接报错

可以设置verify参数为False解决这个问题

r = requests.get(url, verify=False) 

但是设置verify=False会抛出一个InsecureRequestWarning的警告

这样看起来很不好

d8647b12f6b6bf9d54daab78f7c9ceb1.png

解决方法:

from requests.packages.urllib3.exceptions import InsecureRequestWarning# 禁用安全请求警告
requests.packages.urllib3.disable_warnings(InsecureRequestWarning)

运行效果

07d426d101be747dccbbbd2403892ed6.png

285fa800b60f4f8215a82a5a8f2b59ea.png

d767220b73124bd09bf2763aca6a7e4e.png

0654810bd15fc41a0d9707790005536b.png

为了方便各位老哥使用和玩耍,本渣渣特意给各位老哥打包了一下low版exe工具,以便各位大佬哥使用!

exe工具获取

7775a9a1eacc587da4c2797b8c46f0ec.png

百度网盘

链接:

https://pan.baidu.com/s/1Zqst5fLhBZrIiR3XA14cXQ

提取码:

c7mt

参考资料:百度

百度下拉-百度百科

https://baike.baidu.com/item/%E7%99%BE%E5%BA%A6%E4%B8%8B%E6%8B%89/7139864?fr=aladdin

张亚楠博客-seo技术流

PYTHON批量挖掘百度下拉框关键词

http://www.zhidaow.com/post/get-baidu-suggestions-by-python

Sch01aR#-博客园

Python-requests取消SSL验证的警告InsecureRequestWarning解决办法

https://www.cnblogs.com/sch01ar/p/8432811.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_736931.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

服务器购买网站vuter,vscode中安装开发html5中需要的插件

vscode中安装开发html5中需要的插件vscode中安装开发html5中需要的插件最近在学习H5,也开始尝试着用vscode来写h5的代码。vscode是一个很不错的剪辑器,已经用它来写过php,python,还有vue的代码了。最近使用它写H5的代码&#xff0…

xampp配置PHP配置端口,【PHP】xampp配置多个监听端口和不同的网站目录(转)

windows下使用xampp配置多个监听端口和不同的网站目录一:配置Apache文件httpd.conf打开Apache的配置文件httpd.conf,可以通过点击xampp的Apache的config下的Apache(httpd.conf)打开。首先在Listen 80下面添加监听端口如Listen 8001Listen 8002然后在http…

css background-image 高度自适应_打造自适应网站只用一个CSS属性就够了

用一个CSS属性创建一个响应式网站,让我们来看看它是如何做到的。 以这个模板为例,没有应用css属性。 使用 clamp() CSS函数,我们可以创建仅具有一个属性的响应式网站。现在添加魔术CSSclamp(minimum, preferred, maximum);在这里!…

打开是什么样子的图片_3个在线设计效果图网站,可以把图片生成网页扁平网页模板...

点击上方“字体传奇”→点右上角“...”→点选“设为星标★找到3个在线设计效果图网站,可以把图片生成网页扁平网页模板,在网站内上传一张图片,可以生成好几个不同风格的浏览器页面,照片等风格,背景色彩都是可以自定义…

论好用的云主机对于网站运营的重要性

网站的运营对于企业来说,其重要性是不必多言的,不管是企业还是个人,网搭建好后,只有很好地运营起来才能带来收益。既然后期的网站运营对于企业或个人网站来说如此重要,那影响网站后期运营的重要因素又有哪些呢&#xf…

网站被黑该怎么修复漏洞

近日wordpress被爆出高危的网站漏洞,该漏洞可以伪造代码进行远程代码执行,获取管理员的session以及获取cookies值,漏洞的产生是在于wordpress默认开启的文章评论功能,该功能在对评论的参数并没有进行详细的安全过滤与拦截&#xf…

找网站建设工作前的练习,织梦分页列表样式错误问题,没有可点击分页标签只有记录并且样式错误...

因为要去找工作,就想把自己先做个网站到时面试能加分。 于是,织梦登场,当然工作了可能也是必备的。 第一天,文档模板总是提示不存在,但是我已经改了啊,结果搜索了一天答案都没找到问题,第二天醒…

网站验证码的生成原理、难度控制,及python实现...

图片验证码已经广泛的使用在各种反爬虫的场景中,验证码的的生成验证过程对于开发者来说是零成本的,对于用户体验来说可能稍差、但是对于爬虫来说是致命的和高成本的。 下面将介绍使用python实现网站验证码的产生及验证的全过程,然我们对验证码…

C#实现一直疯狂get访问一个网站

好无聊,哈哈,就写了个这玩意,也没什么技术含量using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.IO;using System.Net;using System.Threading;namespace aotoHttpGet{class Program{static…

JAVA游戏停产_烽火18台系列之十四:应急处置“网站一键关停”

前不久,“永恒之蓝“病毒肆虐整个互联网,各网络安全管理员们纷纷忙于打补丁、拔网线、做封堵,那种”想哭“的感觉还记忆犹新,那幅手忙脚乱的画面还历历在目。网络安全工作的重点已经从“防御”一切可能的攻击逐渐转向提升应对攻击…

网站程序有漏洞怎么修复和查找漏洞

ecshop目前最新版本为4.0,是国内开源的一套商城系统,很多外贸公司,以及电商平台都在使用,正因为使用的人数较多,很多攻击者都在挖掘该网站的漏洞,就在最近ecshop被爆出高危漏洞,该漏洞利用跨站伪…

java和seo学那个_seo和java哪个更好

一个seo行业站点,科学的内容制作应该与seo相关,且内容本身是有人搜索的。seo和java哪个更好是有人搜索的语句,且与seo是强相关的,对于seo教程自学网来讲,这样的内容再适合不过了。任何一门技术,如果精通&am…

网站被黑导致被西部数码关闭 提示有害信息未处理的解决方案...

前段时间有一客户的网站打不开了,打开网站被提示什么:抱歉,主机因存在有害信息逾期未处理被关闭 Sorry, the site now can not be accessed. 客户第一时间找到我们SINE安全寻求解决方案,我们根据客户的反馈,进行详细的记录&#x…

百度站长平台的正确使用方式,seoer必备技能!

seo技术指标:如何查看网站的变化利用百度站长平台最为准确,都知道百度自己的产品,当然统计出来的数据也是最为准确的。第一:把网站添加到百度站长平台中去: 搜索资源平台--站点管理 点开站点管理,添加自己的…

家乡网站的设计与实现_博客网站的设计与实现(工具篇)

一、系统的设计目标目标:能够注册用户,用户可以创建自己的博客,而且用户间可以互动。二、开发工具及安装配置MyEclipse,Navicat for MySQL1.1 MyEclipse1、简介:MyEclipse是在eclipse 基础上加上自己的插件开发而成的功能强大的企…

小白在阿里云云服务器上如何发布自己的网站(建站|详细)...

昨天发的小白在阿里云云服务器上如何发布自己的网站(建站|详细),今更新一下 一、选购云服务器 到阿里云官网进行选购1.1 使用学生优惠购买使用学生优惠后为118元/年1.2 市场价购买如果是没有学生优惠的话,请用市场价购买 阿里云还…

网站高可用架构--一

网站的可用性(Availability)描述网站可有效访问的特征。 网站可用性的度量与考核网站可用性度量2.网站可用性考核 可用性指标是网站架构设计的重要指标。从管理层面,可用性指标是网站或者产品的整体考核指标,具体到每个工程师的考…

PageAdmin CMS网站建设教程:自动任务执行时间设置...

PageAdmin Cms发布文章时候有一个上线时间设置和下线时间设置,网站编辑人员可以利用这个功能来实现定时发布,在信息发布界面,如下图: 设置后就会自动加入定时任务中,注意这个功能需要再系统设置>>自动任务执行间…

物流公司网站模板_物流企业网站模板下载

网站模板下载地址:http://www.pageadmin.net/moban/1144.cshtml介绍:物流公司网站模板,DivCss结构,代码干净,搜索引擎更易收录,网站模板精心设计制作,用于物流公司,品牌官方网站的网…

外贸网站最好用的5大WordPress插件【必须安装】

网站装修好了,但是很多细节,很多功能都不能满足,例如我自己是做SEO出来的,所以有些SEO标签没有做好,我自己会觉得很膈应。 因为世界上存在的网站60%都是用wordpress来做的,这就给wordpress插件很好的生存环…