SEO优化-robots.txt解读

news/2024/5/9 22:13:49/文章来源:https://blog.csdn.net/weixin_30359021/article/details/97050892

一、什么是robots.txt

robots.txt 文件由一条或多条规则组成。每条规则可禁止(或允许)特定抓取工具抓取相应网站中的指定文件路径。

通俗一点的说法就是:告诉爬虫,我这个网站,你哪些能看,哪些不能看的一个协议。

二、为什么要使用robots.txt

搜索引擎(爬虫),访问一个网站,首先要查看当前网站根目录下的robots.txt,然后依据里面的规则,进行网站页面的爬取。
也就是说,robots.txt起到一个基调的作用,也可以说是爬虫爬取当前网站的一个行为准则。

那使用robots.txt的目的,就很明确了。

  • 更好地做定向SEO优化,重点曝光有价值的链接给爬虫
  • 将敏感文件保护起来,避免爬虫爬取收录

三、robots.txt的示例

栗子如下:

User-agent: Googlebot
Disallow: /nogooglebot/User-agent: *
Allow: /Sitemap: http://www.wangxiaokai.vip/sitemap.xml

解析:

名为“Googlebot”抓取工具的用户代理不应抓取 http://wangxiaokai.vip/nogooglebot/ 文件夹或任何子目录。
所有其他用户代理均可访问整个网站。(不指定这条规则也无妨,结果是一样的,因为完全访问权限是系统默认的前提。)
网站的站点地图文件位于 http://www.wangxiaokai.vip/sitemap.xml

四、文件规范

1、文件格式和命名

  • 文件格式为标准 ASCII 或 UTF-8
  • 文件必须命名为 robots.txt
  • 只能有 1 个 robots.txt 文件

2、文件位置

必须位于它所应用到的网站主机的根目录下

3、常用的关键字

  • User-agent 网页抓取工具的名称
  • Disallow 不应抓取的目录或网页
  • Allow 应抓取的目录或网页
  • Sitemap 网站的站点地图的位置

五、百度网盘的应用

百度网盘的资源,到博文编写时间为止,已经不能用常用的搜索技巧site:pan.baidu.com 搜索关键字的方式,在baidu.com|google.com|biying.com(国际版还可以勉强搜索到)去搜索对应的资源。
禁止的方式,很大程度上是依靠robots.txt,而不是请去喝茶?。

以下是访问 http://pan.baidu.com/robots.txt 得到的规则:

1.png

可以看到,百度网盘封杀了所有资源文件入口。
最狠的是最后一句:

User-agent: *
Disallow: /

我只想说有资源真的可以为所欲为?

转载于:https://www.cnblogs.com/walls/p/9014687.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_735611.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

net java开发网站性能_TechEmpower Web 框架性能第19轮测试结果正式发布,ASP.NET Core在主流框架中拔得头筹...

TechEmpower 第19轮编程语言框架性能排行榜2020年5月28日正式发布,详见官方博客:https://www.techempower.com/blog/2020/05/28/framework-benchmarks-round-19/,TechEmpower基准测试有许多场景(也称为测试类型),此次评测多了一个综合评分选项…

网站域名空间服务器,网站 域名 空间 服务器

网站 域名 空间 服务器 内容精选换一换本节介绍使用华为云DDoS高防保障业务连续性,且网站域名解析至中国大陆节点服务器的备案场景。如图1所示。① 配置网站域名(www.example.com),接入华为云DDoS高防,把域名解析指向高防IP。② 用户通过网站…

注册网站域名多少钱_新手如何注册域名—建立网站,从域名注册开始

注册域名的一般流程是什么?个人申请域名流程需要知道哪些?一、域名注册流程、方法:1.在网站上注册一个用户名。(http://www.11977.net/reg/ 点击注册 这里我们列举恒派互联)点击注册会员账号2. 登陆会员号。3. 查询你要注册的域名是否被人注册…

服务器建立down文件夹不能,学习笔记五、windows iis网站搭建和ftp服务器配置

安装IIS服务选中文件服务,顺便把ftp文件也装上直接下一步下一步安装完成网站虚拟目录个人理解就是目录建站建立虚拟目录映射对应的具体目录之后,访问采用域名虚拟目录别名/ip虚拟目录别名1、不同端口搭建网站2、不同域名搭建网站(相同ip相同端口&#xf…

网站的客户端和服务器地址,主站和从站与服务器客户端

主站和从站与服务器客户端 内容精选换一换华为云帮助中心,为用户提供产品简介、价格说明、购买指南、用户指南、API参考、最佳实践、常见问题、视频帮助等技术文档,帮助您快速上手使用华为云服务。用户可以在公有云MRS集群以外的节点上使用客户端&#x…

云服务器上传php网站,php代码上传云服务器

php代码上传云服务器 内容精选换一换登录Windows弹性云服务器如图1所示。(可选)使用密钥文件解析密码。对于密钥方式鉴权的弹性云服务器,需先通过管理控制台提供的获取密码功能,将创建弹性云服务器时使用的密钥文件解析为密码。具体操作,请参…

看看来自日本的扫描,做网站需要注意的

2019独角兽企业重金招聘Python工程师标准>>> 今天研究网站日志发现的,一个来自日本IP的网站扫描,总结: 1. 尽量不要用常见的主流CMS,即便用,目录名也要改得面目全非,外加服务器限制直接访问 2. …

wordpress js 运行短代码_WordPress网站速度优化攻略

WordPress网站在内容逐渐增多时,会出现网站速度慢的问题。WordPress网站速度优化也成为了网站优化的重要事项之一。47%的用户只有两秒的耐心等待网站加载。不仅如此,网站还会受到搜索引擎对长时间加载的排名惩罚。为什么WordPress网站速度快不起来网站速…

语音增强 理论与实践 pdf_pdf转换器在线转换可以用哪个免费网站?

今天我将介绍一个在线转换pdf文件的实用网站,它可以帮助大家把pdf转为word、ppt、excel、jpg等文件哦,同时也支持反向转换。有需要的伙伴可收藏网页,这样遇到文档转换的问题就不必花时间找转换工具啦。网站介绍迅捷PDF在线转换器网站功能多样…

部署Nginx网站服务实现访问状态统计以及访问控制功能

Nginx专为性能优化而开发,最知名的优点是它的稳定性和低系统资源消耗,以及对HTTP并发连接的高处理能力,单个物理服务器可支持30000-50000个并发请求。 Nginx的安装文件可以从官方网站http://www.nginx.org/下载,下面以Nginx1.12版本为例&…

可以免费自学编程的12个网站

编程学习本文来自简书,原文地址:http://www.jianshu.com/p/9f094ce31075 很多人包括一些企业家,和市场营销人员都认为学习编程对一个人走向成功十分有帮助。在过去的一年里,我一直在学习编程。它有助我成为一个更好的创业者,我甚至…

PHP如何打造一个高可用高性能的网站呢?

https://blog.csdn.net/jwq101666/article/details/80162245 1. 说到高可用的话要提一下redis,用过的都知道redis是一个具备数据库特征的nosql,正好弥补了PHP的瓶颈,个人认为PHP的 瓶颈在于数据库,像Apache和Nginx的高级web服务器…

怎么修复网站漏洞之metinfo远程SQL注入漏洞修补

2019独角兽企业重金招聘Python工程师标准>>> 2018年11月23日SINE网站安全检测平台,检测到MetInfo最新版本爆出高危漏洞,危害性较大,影响目前MetInfo 5.3版本到最新的 MetInfo 6.1.3版本,该网站漏洞产生的主要原因是Met…

IIS配置和发布网站

一、安装配置IIS 控制面板-》程序和功能-》启用或关闭Windows功能选中“Internet Information Services”,勾选Web管理工具子项,万维网服务子项(万维网中有极少数不用勾选,不做细致描述全部勾选了)。勾选完成后&#x…

资源帖-优秀博客、iOS开发技术文、学习网站

图片发自简书App 一些博客 王巍 Objc中国发起人、Line工程师ibireme YYKit作者bang JSPatch作者唐巧 《iOS开发进阶》作者、猿题库工程师孙源 前百度工程师,现滴滴工程师玉令天下xuyafei张不坏NSHipster中文版glow刚刚在线里脊串Jamin阿毛的蛋疼地zeeyangTian Wei…

关于初创型公司对公司网站的开发与管理内容

WebSite 一、理论和原理二、软件、类库、中间件三、技术相关四、案例分析对于一个网站而言需要知道公司的需求,想要给别人展示的是什么,重点放在哪里,让观众了解或者注重自己的关键点在哪里,方便观众更快更好的了解公司是干什么的…

大型网站技术架构(二)架构模式

2019独角兽企业重金招聘Python工程师标准>>> 每一个模式描述了一个在我们周围不断重复发生的问题及该问题解决方案的核心。这样,你就能一次又一次地使用该方案而不必做重复工作。 所谓网站架构模式即为了解决大型网站面临的高并发访问、海量数据、高可靠…

电脑服务器显示过期,win10系统提示你的设备存在过期风险怎么办_网站服务器运行维护,win10...

win7系统安装后无网络适配器怎么办_网站服务器运行维护win7系统安装后无网络适配器的解决方法是:1、打开控制面板,进入【设备管理器】;2、右键点击异常的驱动程序,选择【更新驱动程序】;3、选择【浏览我的计算机以查找…

利用java爬取网上信息_java爬取网站信息和url实例

https://blog.csdn.net/weixin_38409425/article/details/78616688(出自此為博主)具體代碼如下:import java.io.BufferedReader;import java.io.File;import java.io.FileWriter;import java.io.IOException;import java.io.InputStreamReader;import java.io.Print…

seo代码优化工具_seo外包的内幕曝光_云一哥

为了让企业网站建好后,用有更好的排名,能更快更好的提高品牌形象和宣传力度,那么要选择一家专业的seo外包公司为企业提供服务。那首先就要知道做seo的工作内容,所以云一哥就和大家分享下SEO外包都有哪些工作内容?seo外…