SEO技巧:Shell脚本自动提交网站404死链到搜索引擎

news/2024/5/16 13:15:01/文章来源:https://blog.csdn.net/youcijibi/article/details/77714843

最近在折腾博客主题,通常来说大多数人认为换主题会影响SEO,实际上只要你把工作都做到位了,是没有任何问题的。比如,换主题后你得仔细检查标题和描述等内容是否发生改变、换主题后是否带来了大量的404页面等。当然,更细微的可能是换主题之后,网站的内链网络也发生了微妙的改变,但是整体的影响较小。

SEO技巧:Shell脚本自动提交网站404死链到搜索引擎

总之,张戈博客这次更换主题基本上没有看到明显的SEO影响,反而出现几个新的关键词。好了,题外话到此结束,下面分享一下从Nginx日志分析并生成能提交到搜索引擎的死链文件的Shell脚本。

一、前因后果

今天在看百度站长平台的抓取频次的时候,发现最近抓取次数有所下滑,并且平均响应时间也有所上升,感觉和最近频繁折腾主题以及访问量增加有所关系:

SEO技巧:Shell脚本自动提交网站404死链到搜索引擎

这个问题倒是好解决,等主题稳定了,页面静态缓存文件也就不会频繁被手工删除,整个网站的抓取响应时间应该就能回到正常水平。

再往下看,却发现网站抓取中出现的404数据也呈上升趋势:

SEO技巧:Shell脚本自动提交网站404死链到搜索引擎

实际上,张戈博客以前是手动提交过死链文件的,但后来没时间也就没去搭理更新了。看来这个工作还得重新做起来,并且实现自动化才行了。

二、Shell脚本

说做就做,简单的写了个 Shell 脚本就搞定了!

脚本名称:网站死链生成脚本

脚本功能:每天定时分析网站前一天的 nginx 日志, 然后提取状态码为404并且UA为百度蜘蛛的抓取路径,并写入到网站根目录下的 death.txt 文件,用于提交百度死链。

脚本代码

使用说明:

①、脚本适用于每天都做了日志切割的Nginx,没有做的朋友可以参考博客之前的文章:

nginx日志切割及7天前的历史日志删除脚本

②、将代码保存为 shell 脚本,比如 deathlink.sh,然后如下建立任务计划:

③、执行后,将在网站根目录生成死链文件:death.txt,可以浏览器访问看看内容,比如:

http://zhangge.net/death.txt

④、前往立即前往提交这个死链文件即可:

SEO技巧:Shell脚本自动提交网站404死链到搜索引擎

这样一来,系统会每天执行脚本,将昨天的百度蜘蛛爬到的404路径保存到网站根目录下的 death.txt,以备百度死链抓取工具前来抓取。

效果截图:

下面贴上这几天死链抓取(百度定时抓取,无需人工干预)及处理情况,效果还是非常明显的:SEO技巧:Shell脚本自动提交网站404死链到搜索引擎

值得说明的是,这些死链记录是累加的,已保存的死链数据,就算百度蜘蛛不爬了也会继续保存,需要人工清理,不过一般不清理也没啥问题。

注意事项:

①、如果你的 nginx服务 并没有配置相应的 access 日志,请自行在 server 下添加所需网站的 access 日志,否则脚本无法使用;

②、脚本适用的access日志格式如下:

 

如果和你的不一样,则需要修改脚本中的awk指定的域(即$9、$15以及$7)。

三、其他拓展

①、如果你之前没有做过 Nginx 日志切割,那么可以直接用下面这个脚本来一次性搞定:

②、其他WEB服务器,比如 Apache 或 IIS,只要参考脚本思路,修改成实际的路径或日志字段,同样可以写一个相同功能的 Shell 或 Batch 脚本,有需求的朋友自己去研究折腾吧!

好了,本文暂时就分享这么多,希望对你有所帮助!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_715877.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网站的开发流程介绍(转)

网站的开发流程介绍 从本章开始,我们将学习网站设计和布局技术,其中重点是熟悉网站的开发流程,DIV层和表格布局各自的使用场合,以及网站开发的一些经验、技巧;难点是如何进行网页布局。 创建一个商业网站,要…

LAMP网站架构方案分析

LAMP(Linux-Apache-MySQL-PHP)网站架构是目前国际流行的Web框架,该框架包括:Linux操作系统,Apache网络服务器,MySQL数据库,Perl、PHP或者Python编程语言,所有组成产品均是开源软件&a…

vs2012 发布网站丢失文件

问题描述 在发布网站时,发现上线的网站总是功能缺失,而本地代码确实没问题。 到发布网站的磁盘去查看,发现丢失了很多静态页面文件。 这是一个很奇怪的问题:mvc的网站,丢失了很多View(大部分的cshtml文件都…

Mysql在大型网站的应用架构演变

摘要: 本文主要描述在网站的不同的并发访问量级下Mysql架构的演变历程。架构的可扩展性往往和并发是息息相关,没有并发的增长,也就没有必要做高可扩展性的架构。常用的扩展手段主要有Scale-up和Scale-out两种,前者为纵向扩展&…

一次大规模网站***防御报告

一、 ***描述 年初开始,网站应用服务器网卡流量普遍蹿升到100M以上,其中几台服务器网卡流量更是达到了204Mbps。随之带来的就是访问速度逐渐变慢,网络带宽数次被用完。 二、 ***分析 1、 既然是网卡流出100M以上,那么一定有不正常的请求地址过…

网站测试自动化系统—数据驱动测试

在前面的文章网站测试自动化系统—基于Selenium和VSTT当中,我简单介绍了使用selenium录制测试步骤,以及优化生成的C#代码,对代码使用面向对象的编程理念进行一些封装,以便规避网站界面更动对测试代码所带来的风险。 在网站测试当中…

我的网站

在51cto写文章到现在也有2年了,在51cto博客之前,新浪博客也写了一段时间,14年在这里写的:以前是在新浪博客圈里混,往后技术性的博文都会在这里发表了,提供一个地址,欢迎来访沟通http://blog.sin…

与全球外国人即时聊天的网站

如题,直接给地址 https://chatroulette.com/ 为什么会突然想起这个网站呢,应该是之前有用过,但是自己英文太渣,聊不起来。就放弃了,但是最近刷到一个B站的up主视频,就用类似的软件和全球的外国友人聊天&a…

ASP.NET Visual Studio2010 发布Web网站问题详解

今天研究了一下如何发布web网站,之前总是没耐心,遇到点问题就没心情搞了,今天总算有点耐心搞明白了。其实遇到的问题还是挺多的,网上也没有太全的解释,所以结合自己还有别人的方法进行一下总结。环境:Win7系…

网站如何知道浏览器的用户在使用什么语言?

我们会看到很多支持多语言的网站,有些早期的网站在首页会有一个链接,让用户自己来选希望看到中文,还是英文,现在的网站则不需要了,这些网站可以根据用户使用的语言来显示不同语言的版本。比如,你在使用简体…

使用Awstats统计部署在tomcat中的网站数据

由于项目的需要,所以这几天对AWStats的使用方法做了一番研究,因此把这次的心得体会分享给大家,希望可以给予大家一丝帮助,有疏漏的地方,恳求悉心指正,多谢。 首先说明一下AWStats的用途和特点,A…

设备ip搜索工具_网销侠:网络营销百问百答之49,常用的网站统计工具有哪些...

涛哥网销学,网销可以学。大家好,我是网销侠-涛哥。今天和大家分享的是《常用的网站统计工具有哪些》为什么要网站要使用流量统计工具?因为使用网站流量统计工具可以实时监测网站的访问量以及访客来源,从而更好的分析网站的数据&am…

收集一些Qt学习网站

微信公众号:头号公社 关注可了解更多的教程和资源。问题或建议,请公众号留言; 如果你觉得文章对你有帮助,欢迎赞赏[^1] 正文 最近统计了一系列Qt学习网站,现在分类分享下 Qt 官网 了解Qt最新资讯开发动态的窗口。 Qt 资源下载 最…

aspnet网站设计大作业_提升初中物理作业设计有效性探讨 ——汇贤古华教育集团物理大教研组活动...

提升初中物理作业设计有效性探讨——汇贤古华教育集团物理大教研组活动初中物理作业是初中物理课程的重要组成部分,是实现初中学段课程目标的重要环节,是课堂教学的重要内容。为了进一步提升初中物理作业的有效性,2020年10月29日下午&#xf…

页面布局让footer居页面底部_网站页面底部固定的方法

当我们在写页面时经常会遇到页面内容少的时候,footer会戳在页面中间或什么?反正就是不在最底部显示,反正就是很难看,本章就来解决如何使元素粘住浏览器底部。方法一:footer高度固定绝对定位htmlHeaderContentFootercss…

devc 能优化吗_游戏网站能做SEO关键词推广吗?怎么选关键词?

游戏是一种较强的休闲方式,如王者荣耀、消消乐等,让无数小伙伴都沉迷其中,可以将小伙伴们从紧张的工作中抽离出来,得到精神上的放松。然而,随着各行各业的竞争激烈,游戏网站也是面临着巨大的竞争压力&#…

ECSHOP程序登陆网站后台报错提示:此网页有重定向循环的解决方法

2019独角兽企业重金招聘Python工程师标准>>> 找到后台文件:admin/includes/init.php 打开 将以下内容: if (isset($_SERVER[PHP_SELF])) {define(PHP_SELF, $_SERVER[PHP_SELF]); } 修改成以下内容: if (isset($_SERVER[PHP_SELF]…

一步步构建大型网站架构

之前我简单向大家介绍了各个知名大型网站的架构,MySpace的五个里程碑、Flickr的架构、YouTube的架构、PlentyOfFish的架构、WikiPedia的架构。这几个都很典型,我们可以从中获取很多有关网站架构方面的知识,看了之后你会发现你原来的想法很可能…

网站首页设计

小效果图 html <!DOCTYPE html> <html> <head lang"en"><meta charset"UTF-8"><title>HTMLCSS实战</title><link rel"stylesheet" href"css/style.css"/> </head> <body> <…