php robot.txt,WordPress网站SEO优化——Robot.txt文件编写

news/2024/5/13 9:43:29/文章来源:https://blog.csdn.net/weixin_35642961/article/details/116344519

一、robots 介绍

Robots 协议(也称为爬虫协议、机器人协议等)的全称是 “网络爬虫排除标准”(Robots Exclusion Protocol),网站通过 Robots 协议告诉来访网站的搜索引擎,此网站的哪些页面可以抓取,哪些页面不能抓取。

7add3afa447a3566f94127d25702d7e1.png

robots.txt 是搜索引擎来访网站时查看的第一个文件。当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在 robots.txt 文件,如果存在,搜索蜘蛛就会按照该文件中声明的规则来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面和内容。

在 SEO 中,如果想要让搜索引擎搜索并收录你网站的内容,正确编写robots.txt 文件很重要。

robots.txt 文件通常存放在网站的根目录,但不排除有使用插件等技术将内容封装到数据库中的可能性。

二、robots 组成规则

robots 文件通常由:User-agent、Disallow、Allow、Sitemap 内容组成:

(1)User-agent 规则:

User-agent 用来指定搜索引擎蜘蛛,并限定其在网站上的行为。

User-agent:Baiduspider // 针对百度搜索蜘蛛

... // 该蜘蛛的行为限制规则

User-agent:googlebot // 针对谷歌搜索蜘蛛

... // 该蜘蛛的行为限制规则

User-agent: * // *表示全局变量,针对全体搜索引擎起作用

... // 所有蜘蛛通用的行为限制规则

常见的蜘蛛有

google蜘蛛: googlebot

百度蜘蛛:baiduspider

yahoo蜘蛛:slurp

alexa蜘蛛:ia_archiver

msn蜘蛛:msnbot

altavista蜘蛛:scooter

lycos蜘蛛: lycosspider(t-rex)

alltheweb蜘蛛: fast-webcrawler/

inktomi蜘蛛: slurp

(2)Disallow 规则:

Disallow 关键词,用于定义 禁止 搜索引擎收录的地址。

Disallow: /abc 表示禁止访问收录abc.php、abc.html和abc文件夹下的所有文件。

Disallow: /abc/ 表示仅禁止访问abc文件夹下的所有文件,但是不限制abc.php、abc.html文件。

(3)Allow 规则:

Allow 关键词,用于定义 允许 搜索引擎收录的地址。

(4)Sitemap 规则:

Sitemap 用来告诉搜索引擎网站地图的位置,其中 sitemap.xml 是你的网站的网站地图文件。

Sitemap: http://domain/sitemap.xml

三、设置演示

下面以设置所有蜘蛛爬取 WordPress 网站的行为为例。

1、编辑 robots.txt 文件

禁止所有蜘蛛爬取 Word Press 网站中重要的目录及文件:

User-agent: *

Disallow: /wp-admin/

Disallow: /wp-includes/

Disallow: /wp-content/

Disallow: /wp-*.php

禁止搜索引擎抓取评论分页等相关链接:

Disallow: /*/comment-page-*

Disallow: /*?replytocom=*

禁止搜索引擎抓取站内搜索结果:

Disallow: /?s=*

Disallow: /*/?s=*

禁止搜索引擎抓取收录 feed 链接(feed 只用于订阅本站,与搜索引擎无关):

Disallow: /feed

Disallow: /*/feed

Disallow: /comments/feed

Disallow: /articles/*/feed

禁止蜘蛛爬取 WordPress 下的 readme.html ,licence.txt 和 wp-config-sample.php 文件,降低当前 WordPress 版本等信息对外泄露的风险:

Disallow: /readme.html

Disallow: /licence.txt

Disallow: /wp-config-sample.php

将 sitemap 相关文件添加到 robots.txt ,帮助搜索引擎快速爬取收录你的网站页面:

# 需根据网站实际情况填写。

Sitemap: http://yourdomain.com/sitemap.xml

Sitemap: http://yourdomain.com/post-sitemap.xml

Sitemap: http://yourdomain.com/page-sitemap.xml

Sitemap: http://yourdomain.com/author-sitemap.xml

Sitemap: http://yourdomain.com/offers-sitemap.xml

根据需求,将上述的有关规则按顺序汇总到一个名为 robots.txt 的文件内即可!

温馨提示:

1、上述的 robots.txt 内容仅供参考,请各位站长根据自己网站的实际情况编写内容。

2、如果你不喜欢手工编写指令,可以尝试使用在线robots生成工具:http://tool.chinaz.com/robots/ 。

2、上传 robots.txt 至网站

robots.txt 编辑完成后,将该文件上传至网站服务器,一般是存放在网站的根目录下。当然如果你在 robots.txt 中指定了文件的位置,则应该放置到对应的位置上。

3、测试 robots.txt 是否设置成功

喜欢 (2)or分享 (0)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_738508.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

php代码分析工具,php性能优化分析工具XDebug 大型网站调试工具

大型网站调试工具之一(php性能优化分析工具XDebug) ,开发php的朋友可以参考下。有助于解决php代码的多种问题。一、安装配置1、下载PHP的XDebug扩展,网址:http://xdebug.org/2、在Linux下编译安装XDebug引用tar -xzf xdebug-2.0.0RC3.gzcd xdebug-2.0.0R…

dw怎么保存HTML手机可以看,【dw网页制作】如何使用Dreamweaver制作网页?如何用Dreamweaver制作个人虚拟网站?dreamweaver如何制作手机网站?...

【dw网页制作】如何使用Dreamweaver制作网页?如何用Dreamweaver制作个人虚拟网站?dreamweaver如何制作手机网站?下面就和小编一起来看看吧!如何使用Dreamweaver制作网页?1.建立新的ASP网页并保存2.连接数据库3.在网页中插入模板内容,添加各超链接4.页面设计后&a…

基于机器学习预测Lending Club网站贷款申请结果

前提简介:Lending Club是美国的一家贷款公司,自2007年以来,致力于将借款人和投资者聚集在一起,改变人们获得信贷的方式。在过去的十年中,帮助数百万人控制了他们的债务,发展了他们的小企业并为未来投资。本…

medusa测试网站弱口令简单示例

Medusa 百度百科:希腊神话中的女妖 Medusa(美杜莎)是一个速度快,支持大规模并行,模块化的爆力破解工具。可以同时对多个主机,用户或密码执行强力测试。 Medusa和hydra一样,同样属于在线密码破解工具。但官网着重说明了…

vue页面锚文本_「网站优化」网站优化宝典之描文本优化

相信大家看过我前两天写的网站优化中的标题优化和内容优化;肯定想知道除了标题优化和内容优化还可以优化什么?站内优化之描文本优化,真正好的文章内的描文本可以说是很多人写文章的目标,因为描文本对网站的抓取有一定的帮助。描文…

爱了!安利一个相见恨晚的可视化学习网站

最近日常逛逛技术平台,偶然间发现了一个非常牛逼的可视化学习网站。东哥之前在公众号和技术群里也推荐过一些,但和这个相比我觉得真是太逊色了。 好了,话不多说,我迫不及待地想分享下这个神器。 这个网站的名字叫 图之典&#x…

从机械转行数据科学,吐血整理了这些白嫖的学习网站

作者:东哥起飞 Python数据科学 大家好,我是东哥。 前方高能,准备开启收藏夹吃灰模式。 本篇东哥分享几个数据科学入门的学习网站,全部免费资源,且内容优质,是小白入门的不二选择。东哥当年从机械转行也从…

Python最简洁生成网站二维码的代码

学术网站BalMind的二维码1、共建纯学术网站BalMind2、代码如下:生成BalMind网站二维码 同步佐佑思维公众号二维码如下:1、共建纯学术网站BalMind 2、代码如下:生成BalMind网站二维码 import qrcode qrqrcode.QRCode(version6, #二维码的尺寸…

论文阅读及文献综述 AI辅助网站

目录Web1: 总结文献要点1.1. What this paper is about?1.2. What you can learn?Web2: 文献综述2.1. Related Work2.2. Summary of the Related WorkWeb1: 总结文献要点 https://www.paper-digest.com/ 举例:Robot education peers in a sit…

最大的脚本网站_2020年网站速度优化全面指南

网站速度对于网站而言非常重要,以至于搜索引擎使其成为实际的排名因素。如果您想改善网站速度,第一步就需要对网站进行检测,了解影响您网站速度的因素。其实很多工具都可以为开发人员和网站管理员提供网站速度检测。这里我们推荐的检测工具是…

设计电子商务网站建设方案_涨知识|网站建设方案的设计思路解析

在网站设计方案中关于网站首页的设计思路和解决方案是最重要的,因为用户来到网站后看到的第一个页面基本上都是首页,也是企业网站所有信息的聚集地。所以网站首页大部分情况下决定着用户对网站产生第一印象,是整个网站的门户页面。一、网站开…

百度竞价排名点击软件_百度竞价排名和自然排名,SEO和SEM你都分清楚了吗?

在信息爆炸的互联网时代,如何通过百度帮助您找到您需要的信息,以及如何确定信息的排名顺序?今天我们将整理出百度搜索排名方法,希望给你一些有用的参考。有两种方法:百度竞价排名和自然排名一、竞价排名(SEM)竞价排名…

移动互联网站之html5单页面设计,html5 移动端单页面布局

移动端的web网页使用的是响应式设计,但一般我们看到的网站页面都是跳转刷新得到的,比如通过点击一个menu后进入到另一个页面今天来说下是移动端的单页面的布局。单页面就是一切操作和布局都是在一个页面下进行 不需要页面跳转 ,再通俗的说就是…

Chrome浏览器出现无法访问此网站/无法显示此网页的错误,怎么解决?

出现"无法访问此网站"或"无法显示此网页"的错误,有很多原因会导致这个问题发生,下面说明如何解决这个问题。 升级Chrome到最新版本,首先确认您的Chrome已经升级到了最新的稳定版,将Chrome升级到最新版本&…

个人建站工具Wordpress学习

简单了解 WordPress是使用PHP语言开发的博客平台,用户可以在支持PHP和MySQL数据库的服务器上架设属于自己的网站。是一个免费的开源项目,在GNU通用公共许可证下授权发布。 【Wordpress程序】 相当于家的主体框架。 【Wordpress模板】 相当于家的装修。 …

个人快速搭建Wordpress建站教程(博客用途)

简言 在初步了解了Wordpress之后,我们这里来尝试搭建一下Wordpress。其实这个相比于其他的搭建博客方式算是比较简单的了。像使用hexogithub搭建的方式使用的人也很多,这些方式还需要了解一些基本的命令行知识和git操作。来来来,话不多说这里…

maxvalue mysql自动分区_网站优化之 mysql 优化三

网站优化从三方面着手 web 服务器后台程序数据库触发器1.简介触发器也叫触发程序,触发器是个特殊的存储过程,但是触发器不需要CALL语句调用,也不需要手动启动。它由事件触发,事件包括 insert,update,delete…

wap pc html,PCWAP手机PC网站信息管理系统 v1.4.3

PCWAP手机PC网站信息管理系统简介PCWAP信息管理系统可以轻松的管理手机版网站和PC版网站,以简单的功能灵活的标签调用可以使PCWAP成为几乎可以满足各种网站需求;手机建站源码程序总大小才1MB。PCWAP手机PC网站信息管理系统主要功能手机网站管理一个后台同…

网站服务器没有数据库备份,只有网站文件,忘记备份数据库,恢复网站后台登录的2种有效办法...

问题描述:网站从旧服务器搬运到新服务器,忘记备份数据库了,登录网站后台提示错误“连接数据库失败,可能数据库密码不对或数据库服务器出错!”。不用慌张,出现这种情况的原因是没有把数据库一起备份并下载下…

测试中使用定位搜索框搜索内容_关于网站中搜索的那些事儿-下集

目录:什么时候你需要一个搜索功能?使用熟悉的放大镜图标;保持你的搜索栏突出;提供一个提交按钮;保证每个页面都提供了搜索框(全局性搜索);保证搜索框的输入区域足够长;展…