ROBOTS.TXT在SEO优化中的运用(ROBOTS.TXT SEO优化实战)

news/2024/5/8 12:00:47/文章来源:https://blog.csdn.net/weixin_34235371/article/details/92692241

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

豆瓣网的robots.txt中有Crawl-delay、Visit-time、Request-rate,好多人搞不清楚这是什么含义,因为平时大家用的最多的是User-agent和Disallow。不会写的新手们可以参考下http://www.douban.com/robots.txt

内容如下:
========================================================
User-agent: *
Disallow: /subject_search
Disallow: /amazon_search
Disallow: /forum/
Disallow: /new_subject
Disallow: /service/iframe
Disallow: /j/
Disallow: /link2/
Sitemap: http://www.douban.com/sitemap_index.xml
Sitemap: http://www.douban.com/sitemap_updated_index.xml

User-agent: Slurp
User-agent: Sosospider
Crawl-delay: 5
Visit-time: 0100-1300
Request-rate: 40/1m 0100 - 0759
Request-rate: 12/1m 0800 - 1300

========================================================

下面来解释下含义:

robots.txt文件中各项目的格式为: :
常用的field有Allow, Disallow, Request-rate, Visit-time, User-agent, Robot-version等.robots.txt文件中的注释以'#'开始.可以为独立的一行,也可以一行的后面部分.下面对每一个field,也叫directive进行一一介绍:

1. User-agent: The value of this field is the name of the robot the record is describing access policy for.
例子:User-agent: *
在这里*代表,any robot that has not matched any of the other records

2. Disallow: 指定不能访问我URL
例子: Disallow: /foo.html #foo.html不能访问
Disallow: #该目录下所有URL都可访问
Disallow: / #该目录下所有URL都不可以访问

3. Allow: 用来指定能访问的URL, 这个在当指定所有URL为不可访问,然后可以用这个排除特殊的一些. 这时候比较方便.
例子: Allow: / #允许访问所有URL

>>>> 一般的网站基本用到这些,下面用的就不多了,所以好多人看不懂,一般大型网站用的比较多,大家可以学习下。

4. Robot-version: 用来指定robot协议的版本号
例子: Robot-version: Version 2.0

5.Crawl-delay:雅虎YST一个特定的扩展名,可以通过它对我们的抓取程序设定一个较低的抓取请求频率。您可以加入Crawl-delay:xx指示,其中,“XX”是指在crawler程序两次进入站点时,以秒为单位的最低延时。

6. Visit-time:只有在visit-time指定的时间段里,robot才可以访问指定的URL,否则不可访问.
例子: Visit-time: 0100-1300 #允许在凌晨1:00到下午13:00访问

7. Request-rate: 用来限制URL的读取频率
例子: Request-rate: 40/1m 0100 - 0759 在1:00到07:59之间,以每分钟40次的频率进行访问
Request-rate: 12/1m 0800 - 1300 在8:00到13:00之间,以每分钟12次的频率进行访问

另外还有一点:robots.txt文件里还可以直接包括在sitemap文件的链接。就像这样:
Sitemap: http://www.seohua.net/sitemap.xml (此处请填写XML地图的绝对路径,即完整URL,如果按习惯填写Sitemap: /sitemap.xml,提交给Google网站管理员工具后会提示:检测到无效的 Sitemap 网址;语法错误。
XML地图必须在网站根目录下才有效。)
相关日志
网址重定向的方法
301重定向
301与302转向的区别

影响Google排名的因数总结

 

更多相关链接

http://www.chedong.com/blog/archives/001195.html

http://oss.org.cn/?action-viewnews-itemid-64848

http://ying.hopto.org/wp/2007/02/190/

转载于:https://my.oschina.net/zhangdapeng89/blog/42745

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_712576.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【强烈推荐】如何解决JQuery类Post方式的跨域问题 - 空山雪林通用模块设计工作室 - ITeye技术网站...

【强烈推荐】如何解决JQuery类Post方式的跨域问题 - 空山雪林通用模块设计工作室 - ITeye技术网站【强烈推荐】如何解决JQuery类Post方式的跨域问题 博客分类:核心代码片段jQueryjsonFlashXML工作在很多应用场景,利用JQ的getJSON解决跨域问题是首选&…

22号大更新网站大面积降权的原因分析

22号端午节是个美好的日子,但对于众多站长来说,这一天并不快乐,因为百度算法发生改变导致很多网站降权了,特别是一些老站从排名很好,一夜回到解放前;很多站长认为是百度内部数据错误导致的,三天…

好久没弄网站多皮肤了

最近项目中用户有对网站提多皮肤的需求,想在不同的节假日(季节)给网站换不同的皮肤,比如国庆日、中秋节、端午节、建党节、春节、春天、夏天、秋天、冬天等等。主要技术就是用程序(前台脚本和后台模板引擎均可&#xf…

工具网站

2019独角兽企业重金招聘Python工程师标准>>> http://www.williamlong.info/archives/1632.html 介绍不部分好用的软件 http://www.filebuzz.com/findsoftware/Agile_Java/1.html 一些java的使用工具大全 IntelliJ IDEA 的官方网址是 http://www.jetbrains.…

浅析天际网、IT260、微人脉等中国职业社交网站

近日,国内外互联网巨头纷纷进驻职业社交领域,先是facebook推出求职应用“社交求职”,然后是搜狐推出了IT260,紧接着新浪在微博基础上推出微人脉,再加上这个领域耕耘多年的天际网(www.tianji.com&#xff09…

底层小程序员 练手做一个网站不小心赚了几十亿

现在的人都说互联网是个神奇的领域,是创造财富最快的地方。前几天2018年胡润富豪榜公布的时候,80后富豪基本上快清一色的互联网行业人才。今天小编要给大家介绍一个创造财富的牛人,本身自己就是个码农,搭建一个网站玩玩&#xff0…

网站操作系统HttpOS2.2安装图解教程

说明: 镜像下载地址: http://down4.zijidelu.org/projects/httpos/files/httpos-2.2-x86_64.iso http://down3.zijidelu.org/httpos-2.2-x86_64.iso 1、镜像下载后,刻录光盘,设置从光驱启动; 2、Http OS 安装选项&…

发布一个MsBuild任务组件-可用于同时发布多个网站

组件项目: /Files/jillzhang/Publishers.rar 演示项目: /Files/jillzhang/PubliserSample.rar 在Vs 2005 没有打Sp1的时候,可以用aspnet_compiler.exe来实现发布网站的目的,它是一个命令行工具,在进行持续化集成的时候…

网站运营直通车——7天精通SEO

为什么80%的码农都做不了架构师?>>> 网站运营直通车——7天精通SEO SEO是网络营销一门不可或缺的营销手段,从各种营销方法来看,SEO是营销成本最低 且效果最好的营销手段,因此掌握此门技术已经成为众多网络营销人…

网页设计与网站组建标准教程(2013-2015版)

为什么80%的码农都做不了架构师?>>> 网页设计与网站组建标准教程(2013-2015版) 本书全面讲述 了网站创建、网页制作基本知识、网页制作集成工具使用的方法等内容。通过本书的学习,可使学生 掌握构建网站的基本知…

一次外网打不开网站的故障总结

先说一下公司网站的架构,公司的前端用KeepalivedLVS做的负载均衡,后面跟的是WEB服务器,WEB和IMG独立,IMG采用NFS存储服务器,IMG前端用Squid做的缓存。整个网站前面用的是金盾的防火墙,网站的整个架构并不复杂。在9月22…

电脑怎么打字切换中文_五个练习打字的网站,让你的速度飞起

相信现在还是有很多人打字靠『二指禅』,但这种打字方式效率还是有点低下。如果想尽快提升效率,还是尽快学会全键位盲打吧。如果你在网上问,到底该怎么提高打字速度?常见的回答都是这样,在QQ上找人聊天就好,…

Win7系统下网站发布IIS配置

*本帖为个人收集贴,所有版权归:西门的后花园 http://ons.me*Technorati 标记: IIS,网站,发布,配置一、首先是安装IIS。打开控制面板,找到“程序与功能”,点进去二、点击左侧“打开或关闭Windows功能”三、找到“Internet 信息服务…

wpf esc key 检测不到_爬虫笔记之requests检测网站编码方式(zozo.jp)(碎碎念) - CC11001100...

发现有些网站的编码方式比较特殊,使用requests直接请求拿是得不到正确的文本的,比如这个网站:当使用requests访问网站,使用方式取响应文本的时候,会发现得到的是奇怪的内容:#!/usr/bin/env python3 # encod…

创建MOSS网站下的新闻

MOSS新闻中心的原理,跟普通的通知列表是不同的,MOSS新闻中每一条新闻即为一张页面,页面存储在站点的Pages文档库中。手工创建新闻 网站操作,下选创建页面 如下的界面如下:(点击图片查看清晰图)在输入框中输入相应的内容&#xff0…

PerfMap – 显示前端网站性能的热力图插件

PerfMap 是用来分析前端性能,基于资源定时 API 生成网页资源加载的前端性能热图。热图的颜色和第一个毫秒值指示在什么时候页面的图像加载完毕,这是用户体验的一个很好的指标。括号中的第二个值是浏览器加载特定图像的时间。 Github主页 插件下载 您…

Microsoft Azure WebSite创建网站

Microsoft Azure WebSite是Microsoft Azure中PaaS平台既服务到一个重要组件,WebSite具有以下特点,方便我们WEB部署和上线发布l 入门简单,开始简单,可以按照你的想法扩展,无任何的困难。l 编码容易,可以使用…

php手机网站支付宝_PHP实现支付宝手机网站支付功能

PHP实现支付宝手机网站支付功能的方法:首先开通支付宝商家中心里面的手机网站支付;然后进入开发者中心,获取到APPID;接着去文档中心下载“DEMO”;最后将“demo”配置到项目中即可。PHP实现支付宝手机网站支付功能1.开通…

php 系统找不到指定的路径.,PHP网站(windows2003服务器 IIS6)提示:系统找不到指定的路径。...

今天早上起来一看其它某php网站(下称:A站),直接就提示:“系统找不到指定的路径。”,其它的什么也没有。输入网站的各种网址都是这样。回想一下近期的操作,由于服务器的PHP版本太低,自己下载了下个phpStudy(…

想让自己的网站变得精致吗?那就进来看看吧:跟随鼠标的天使

跟随鼠标的天使 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><meta http-equiv"X-UA-Compatible"…