robots.txt 不让搜索引擎收录网站的方法

news/2024/4/27 9:04:25/文章来源:https://blog.csdn.net/tank376574984/article/details/84627449

1.搜索引擎如何工作的?

简单的说,搜索引擎实际上依靠的庞大的网页数据库。按搜索方式可以分为 全文搜索 和 目录搜索 两种。

所谓全文搜索,是搜索引擎通过从网页自动提取信息来建立数据库的过程。至于提取的原理,就是SEO狂热者们所研究的算法,在他们的理想情况下,网页应该是针对搜索引擎设计的,具有最好的收录效果。当然,不是本文的话题。搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间(比如Google一般是28天),搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,它在一定时间内(2天到数月不等)定向向你的网站派出“蜘蛛”程序,扫描你的网站并将有关信 息存入数据库,以备用户查询。

与全文搜索引擎相比,目录索引有许多不同之处。目录索引完全是手工操作的。

首先,搜索引擎属于自动网站检索,而目录索引则完全依赖手工操作。用户提交网站后,目录编辑人员会亲自浏览你的网站,然后根据一套自定的评判标准甚至编辑人员的主观印象,决定是否接纳你的网站。

其次,搜索引擎收录网站时,只要网站本身没有违反有关的规则,一般都能登录成功。而目录索引对网站的要求则高得多,有时即使登录多次也不一定成功。尤其象Yahoo!这样的超级索引,登录更是困难。

最后,搜索引擎中各网站的有关信息都是从用户网页中自动提取的,所以用户的角度看,我们拥有更多的自主权;而目录索引则要求必须手工另外填写网站信息,而 且还有各种各样的限制。更有甚者,如果工作人员认为你提交网站的目录、网站信息不合适,他可以随时对其进行调整,当然事先是不会和你商量的。

目录索引,顾名思义就是将网站分门别类地存放在相应的目录中,因此用户在查询信息时,可选择关键词搜索,也可按分类目录逐层查找。如以关键词搜索,返回的结果跟搜索引擎一样,也是根据信息关联程度排列网站,只不过其中人为因素要多一些。

2.如何拒绝搜索引擎?

其实很简单的,只需要在网站的根目录中放一个名称为Robots.txt的文件,该文件的写法很有讲究的哦,务必按要求写,写法如下:

1)什么是Robots.txt?

Robots.txt是一个文本文件,关键是这个文件所在的位置:在网站的根目录下。弄错了,就不起作用了!

2)Robots.txt如何起作用?

前面提到过搜索引擎的自动提取信息会遵循一定的算法,但是,无论算法如何,第一步都是在寻找这个文件。其含义是,“贵站对我们这些Robots有什么限制?”所谓的Robots就是搜索引擎派出的蜘蛛或者机器人。如果没有得到回应(没有找到这个文件),代表没有什么限制,尽管来抓取吧。如果真的有这个文件,机器人会读来看看,如果自己被拒绝就会停止抓取过程了。

3)怎么写Robots.txt文件?

遵循语法的Robots.txt才可能被机器人识别,至于语法,介绍起来很繁琐,现简单举例如下:

1)禁止所有搜索引擎访问网站的任何部分(也就是网站彻底的拒绝所有搜索引擎收录)

User-agent: * 

Disallow: /

2)允许所有的robot访问(也就是网站允许所有搜索引擎收录)

User-agent: * 

Disallow:

3)禁止某个搜索引擎的访问(比如禁止百度收录,按如下的方式写)

User-agent: baiduspider 

Disallow: /

4)允许某个搜索引擎的访问(比如允许百度收录,按如下的方式写)

User-agent: baiduspider

Disallow: 

User-agent: * 

Disallow: /

5)禁止搜索引擎访问某些目录 

User-agent: *

Disallow: /cgi-bin/

Disallow: /tmp/

Disallow: /images/

使用方法:很简单,将代码存为一个文本文件,命名为Robots.txt ,放在网页根目录即可。

注意:所有语句都是单规则的,即每行仅声明一条规则,比如例五中三个目录必须分三行列出来。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_854658.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Django建立一个音乐网站(一)

Django是python学习的一个分支。最近跟着书上在学习。关于书上的项目我觉得拿来练手非常合适。而且涉及了数据库,html相关知识,对程序员的学习关联性我觉得还是有很大的提升的。 根据《玩转Django2.0》在此理解记忆关于python在Django中的使用。 Djang…

Django建立一个音乐网站(二)

初步模板建立完成之后,就是数据的保存。数据也算是当前互联网中最热门的话题。 数据库的配置是西纳泽项目所使用的数据库的类型,不同的数据库需要设置不同的数据库引擎,Django提供4种数据库引擎。分别是: django.db.backends.my…

Django建立一个音乐网站(四)

之前将网站一些该有的元素都准备完成了。接下来就是关于用户注册和后台admin设置。 user模块 关于一个网站的浏览量是靠用户的数量来决定的。所以每一个用户在网站的操作,要做出限制。这个是可以实现的。接着还有一些个人的账号和数据信息可以完善,让管…

中小规模网站架构解析

中小规模网站架构组成 1)用户访问网站的人员 2) 防火墙 (firewalld)进行访问策略控制 3) 负载均衡服务器 (nginx)对用户的访问请求进行调度处理 4) web服务器 (nginx)处理用户的请求 5) 数据库服务器 (mysql)存储的字符数据 6) 存储服务器 (nfs)存储图片 音频 视频…

阿里云ECS服务器部署LNMP实现WordPress站点搭建创建自己的博文网站

网址https://developer.aliyun.com/topic/ecs2022 选择网址可获得一个月的体验机会 配置如上图选择立即购买,下一步即可,购买完毕后等待三分钟修改密码,先进入esc工作台,选择实例 修改完密码后等待重启,重启成功可…

扎克伯格13年前写的Facebook网站代码,你见过吗?

2017年的扎克伯格身价狂飙,越来越接近比尔盖茨。 看他在科技界的战绩,总算成为一个没有被代码耽误的商业奇才! 那么,扎克伯格的编程水平如何呢? 网友一:扎克伯格一个星期建立了Facebook网站,水平…

2017 年最受欢迎的 11 个编程挑战网站

如果你正在在学习编程,那么我可以告诉你一个提高技能的好方法,那就是敢于去解决编码过程中遇到的难题。解决不同类型的难题,可以帮助你成为一名优秀的问题解决者;不管编程语言多复杂,你也会得心应手;另外在…

毕业生--参考文献查询网站及方法(中文核心及以上)

一、知网 (1)以我为例,是用校外访问登录,可以免费下载知网文献资源。 (2)进入新版知网,使用高级检索。 (3)进行多条件筛选检索。 小提示:全部期刊包括了除核…

有权限的网页能分享内页?_如何做好网站内页的SEO优化?

SEOer们都清楚,企业招聘SEO目的是什么?很简单,获得更多的网站流量,提高流量转换率,最终完成订单交易。然而,许多搜索引擎只专注于优化首页上的几个关键词,而内页上并没有优化的痕迹。只有一个结…

8个获取手机应用程序设计灵感的网站

曾经,CSS 画廊非常流行,网页设计师们会定期访问这些网站获取灵感。现在仍然可以方便迅速找到令人兴奋的东西(例如 Dribbble 和 Behance 对设计有很大的帮助)。 对于移动应用程序设计,存在类似的画廊,我相信…

带给您灵感的25个最新鲜的 HTML5 网站

感谢 HTML5 带来的惊人的先进特性,在未来几年,HTML5 将会继续发挥巨大的推动作用,不仅是在 Web 应用中,网页设计领域也会有新的变革。今天,我们在这里集合了能够带给您灵感的25个最新鲜的 HTML5 网站。 NeddStereo Cre…

经典网页设计:20个新鲜出炉的 HTML5 网站

经典网页设计系列精彩继续,今天这篇文章向大家展示20新鲜出炉的 HTML5 网站作品,让大家感受一下 HTML5 的魅力。HTML5 新增了许多重要的特性,像 video、audio 和 canvas 等等,这些特性使得能够很容易的网页中包含多媒体内容&#…

神奇的滚动动画,30个视差滚动网站设计

使用 HTML5 和 CSS3,我们能够在浏览器中创建更有趣和更吸引眼球的效果。其中,视差滚动(Parallax Scrolling)就是这样的效果之一。这种技术通过在网页向下滚动的时候,控制背景的移动速度比前景的移动速度慢来创建出令人…

经典网页设计:使用颜色滤镜效果的20个网站

大的背景图像已经成为了今年网页设计的趋势。在图像排布文本和按钮并很好的搭配相当具有挑战性。因此,设计师使用创意的 Photoshop 滤镜和渐变来在图像上创建一个遮罩,并在其上放置其他的网页设计元素。这种新鲜的设计给网站带来独特的光泽。在此&#x…

HTML5初学者福利!11个在线学习网站推荐

HTML5的强大及流行趋势,让更多的人想要系统的对它进行学习。而大多数人获取HTML5知识的重要途径都是网络,不过面对五花八门的搜索结果,是不是觉得摸不着头脑,无法抉择?在这里,文章作者Abhishek Thakur以自己…

自媒体人必备:国内最专业的自媒体平台导航网站,有它就够了

这个自媒体导航是小编自己搭建的网站,yechuang.top/nav/zimeiti 主要收录了自媒体人常用的网站、工具、书籍。 自媒体人的超级搜索条做为一个资深的收集控,我愿意把自己收集的资源分类整理后免费分享出来 小编在网站上添加了一个超级搜索条,聚…

UI设计网站 | 常用的UI设计网站大集合

好多小伙伴知道的UI设计网站可能也就那么几个,今天给大家整理了一些经常跟新的UI学习网站,每天坚持浏览这些网站,多看大神的作品和文章,可以快速的提升你的UI设计水平,切记,不要只是看,要一边看…

11个LOGO设计灵感网站推荐,帮你提高LOGO设计工作效率

设计LOGO是一件很费脑细胞的活,需要很多的创意灵感,今天给大家把一些专业的LOGO设计网站和LOGO图库整合在一起了,希望大家能多一些灵感创意,能保质保量的完成你的LOGO。 LOGO大师 http://www.logodashi.com LOGO大师网是国内领先的…

产品经理必须知道的PM社区和好用的原型工具网站

我们平常需要用到很多产品经理网站,今天分享一些优秀的产品经理网站,相信可以很好地提高你的工作效率。 好多产品经理或者刚转行的朋友总是在画原型的时候缺乏灵感,或者想找一下可以参考的原型或思路,那小编本期整理了一下产品经…

免费开源的建站程序大全,不会编程也可以自助搭建网站了哦

想建网站又不会编程的小伙伴有福啦,本期推荐一些开源的cms建站程序,不需要写后端的任何逻辑代码,轻轻松松就可以建立自己的网站了,当然,要想网站有自己的个性,模版还是需要自己写的,只需要会简单…