网站遇到Bytespider爬虫该怎么办?

news/2024/5/9 22:22:26/文章来源:https://blog.csdn.net/li1017099394/article/details/96488281

早上打开网站,发现超级卡,以为是网速原因,调试了路由器无济于事,都说重启大法好,重启那就重启web服务试试,可惜依旧没用,不过重启的时候发现CPU彪到99,我还以为是被谁Doos了。

发现问题:

查看日志发现是来自于Bytespider的爬虫。

服务器配置是4H8G10M,基本上中型 网站这配置都够了,我还是刚搭建的没有什么流量,就被这Bytespider给拖垮了。

爬虫IP基本上都是来源石家庄,而且是同IP段,一直在爬取,网上找有的说是头条的蜘蛛(没有证据)。

解决思路:

1.因为我没有服务器的登录权限,所以我猜想用CC防护和web应用防护能否阻挡呢?

使用阿里云最基础的“web应用防护”,开启后并没有什么效果,5分钟过去,cpu依旧99%。

2.推测使用拉黑IP段的方式来解决。

先整理出这些爬虫的IP段:

60.8.165.0/24

111.225.0.0/24

110.249.0.0/24

220.243.0.0/24

基本为这四个ip段,对这四个IP段进行拉黑,在web应用安全这里进行配置规则。

si

四个IP段拉黑后,服务器cpu瞬间将至10%。

问题解决。

 

结论:

Bytespider爬虫虽然不比Doos,cc,可是对于web服务来讲多大的服务(相对来讲)都能拖垮~~~~~。一定要ban掉。

 

二、这是测试有效的方式,还有网上找到的另外一种方式,通过ningx 拉黑ip:

在Nginx的conf目录下面建立blockip.conf文件(名称可以随意),把想要屏蔽的IP只要加入这个文件即可,格式如下:

deny 195.91.122.67;

一行添加一个,添加完成后保存。

在Nginx的配置文件XX.conf按照相应格式加入代码如下,唯一需要注意的是相对路径。

1	include blockip.conf; 

重启Nginx:

/usr/local/nginx/nginx -s reload

屏蔽ip的文件既可以屏蔽单个ip,也可以屏蔽ip段,或者只允许某个ip或者某个ip段访问。

#屏蔽单个ip访问
deny IP;#允许单个ip访问
allow IP; 
#屏蔽所有ip访问
deny all; 
#允许所有ip访问
allow all; 
#屏蔽整个段:从123.0.0.1到123.255.255.254
deny 123.0.0.0/8;
#屏蔽IP段:从123.45.0.1到123.45.255.254
deny 123.45.0.0/16;#
屏蔽IP段:从123.45.6.1到123.45.6.254
deny 123.45.6.0/24;

除了几个IP外,其他全部拒绝,那需要你在blockip.conf中这样写:

allow 1.1.1.1;
allow 1.1.1.1; 
allow 1.1.1.2;
deny all;  

单个网站屏蔽IP的方法:把include blocksip.conf;放到网址对应的在server {}语句块;多个网站屏蔽IP的方法:把include blocksip.conf;放到http {}语句块。

方法二没有测试,具体效果不明,


想到哪里写到那里,文章可能不通顺,解决问题最重要。

梦想成为技术大佬,却被现实按在地上摩擦的小白敬上。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_865654.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何防止网站被侵入,如何防止网站被挂马,如何防止网站被入侵?

一:挂马预防措施: 1、建议用户通过ftp来上传、维护网页,尽量不安装asp的上传程序。 2、对asp上传程序的调用一定要进行身份认证,并只允许信任的人使用上传程序。这其中包括各种新闻发布、商城及论坛程 序,只要可以上传…

android学习笔记15--------------获取网站html

转载注明出处:袁方的技术博客 http://blog.csdn.net/yf210yfimport java.io.ByteArrayOutputStream; import java.io.File; import java.io.FileOutputStream; import java.io.InputStream; import java.net.HttpURLConnection; import java.net.URL;import junit.f…

电脑网站中有哪些有趣却不出众的小众网站呢

我们在使用电脑的时候会发现不少有趣的电脑网站,这些网站的名声并不出众,但是这些小众的网站却有很多有趣的故事和图片。我们在这些小众的网站上还可以看到一些世界上发生的一些有趣的、奇异的小故事,还有一张张美丽的图片在网站上展示出来。…

给网站添加“开放搜索描述“以适配浏览器的“站点搜索“

背景 要在一个常用网站搜索,想必大部分人会这样: 访问这个网站的的主页或者任意一个带搜索框的页面聚焦输入框,输入关键词并Enter 而如果一个网站适配了浏览器的"站点搜索"(site search)特性,…

Android开发时,那些相见恨晚的工具或网站!

本文来我在知乎话题Android开发时你遇到过什么相见恨晚的工具或网站?下的回答! 在实际Android开发过程确实会有很多相见恨晚的工具或网站出现,下面是我自己的一些分享。 1、源码网站 https://github.com/googlesamples Android系统每次推出一…

用织梦创建本地网站通过Tomcat成功部署到Linux服务器详细教程(Ubuntu16.04)

用织梦创建本地网站成功部署到Linux服务器全过程详细教程(Ubuntu16.04) 织梦创建本地网站成功部署到Linux服务器详细教程(Ubuntu16.04) 本教程旨在帮助那些建网站小白如何从头搭建起本地网站并且最终上传到自己或公司的服务器上…

显示网站Alexa世界排名的代码

作者:佚名 转贴自: 苹果理想3dapple Alexa世界排名众多站长已经不会陌生了,今年将它炒的非常厉害,众多网站不论是拉广告还是做宣传都会以Alexa世界排名作为依据。因此,在这里西部E网(weste.net&#xf…

关于我的个人网站(一)

这两天我中国丫头这个个人网站突然打不开了,空间是用的朋友的,大概是出什么问题了吧,反正也没有再去更新了,也没有问朋友原因,他也忙,也不能总是麻烦人家,关闭了就关闭了,早就有重新…

关于我的个人网站(二)

现在要说的就是中国丫头这个网站了,也是2003年九月份做的.... 点击这里进入

出来混迟早要还的-Alexa开始清算 国内作弊网站几乎全部落网

作者:周腥腥的博客 来源: 博客中国出来混迟早要还的,Alexa的报复行动开始了.Alexa的行动从2005年1月21日开始了......Alexa的作弊网站一个一个露出了原形.Alexa作弊最近一段时间已经成为的热门话题,作为一个相对权威排行,它肯定会尽可能的去阻止作弊,更不允许某些人…

如何在爱课程网站下载视频与课件

如何在爱课程网站下载视频与课件 如何下载视频与课件如何在MacOS中安装Python 最近要看些水声物理的东西,就必须掌握数学物理方法,可惜大学荒了这门手艺,只能重新啃啃书捡一捡,于是乎搜索了一下知乎,看到了如下链接&am…

提高网站访问速度的四个有效方法

通过站长工具查询能了解到,一些租用海外服务器的网站,特别是用香港服务器的网站,打开速度跟放在国内服务器的网站并无差异。放在海外服务器的网站,特别是香港服务器的网站,是如何做到网站速度快的?如果网站…

如何提高在外国网站下载软件或文件的速度

大三刚开学的时候,为了学习Linux操作系统,决定下载个Linux虚拟机,于是我就到了VWware-workstation官网下载,一看一个500M的软件下完需要一天多的时间。。。想到这就没耐心了。 大家都知道在本地的浏览器访问外国网站下载软件网速…

什么是抖音SEO?抖音SEO优化怎么做?

什么是抖音SEO? 抖音SEO优化怎么做?抖音SEOSEO是Search Engine Optimization的简写,中文名搜索引擎优化。抖音SEO是针对抖音搜索的优化技术,是指通过提升目标视频的视频质量和相关性使得目标视频符合抖音搜索的排名规则&#xff0…

SEO需要用的1000个高PR值论坛资源

SEO需要用的1000个高PR值论坛资源,是你提高网站权重的必备工具,由站长广告网收集,编辑。 SEO需要用的1000个高PR值论坛资源.doc

用Python爬取并分析Box Office Mojo网站2019年每日票房数据

最近在处理一些和有关电影的工作,需要用到一些北美电影票房数据,而这部分数据最权威的网站当属Box Office Mojo(以下简称BOM),于是就上去查看了一下。估计经常关注这个网站的盆友们都知道,这个网站最近刚刚…

动态代理IP对seo网站运营的影响

seo搜索引擎优化,是网站优化的基本操作,利用seo的优化手段,我们网站的关键词就会逐步的向前递增,从而增加网站的权重,引入流量。但是当我们网站的关键词排名靠后,但是使用正常的优化手段在短时间内没有办法…

网络编程–一起来做网站客户端

【iPhone】网络编程–一起来做网站客户端(一) 发表于 2012 年 3 月 31 日 由 Apan 最近几天,一直在学习网络编程方面,我觉得这是移动开发必须了解的知识吧 在实践中学习,才是最好的方法 于是就决定为公司OA系统做一个…

使用IntelliJ IDEA开发SpringMVC网站(二)框架配置

华为软件开发云5月大聚惠,8大服务限时免费,拼手气赢华为Mate9!>>> 摘要: 讲解如何配置SpringMVC框架xml,以及如何在Tomcat中运行 转载请注明出处:Gaussic(一个致力于AI研究却不得不兼顾项目的研…

使用IntelliJ IDEA开发SpringMVC网站(二)框架配置

华为软件开发云5月大聚惠,8大服务限时免费,拼手气赢华为Mate9!>>> 摘要: 讲解如何配置SpringMVC框架xml,以及如何在Tomcat中运行 转载请注明出处:Gaussic(一个致力于AI研究却不得不兼顾项目的研…