SEO优化:WordPress发布文章主动推送到百度,加快收录保护原创

news/2024/5/18 15:21:57/文章来源:https://blog.csdn.net/weixin_33920401/article/details/93419269

工作实在太忙,也没时间打理网站。最近公司额外交待了一些网站 SEO 方面的优化任务让我关注(这就是啥都要会、啥都要做的苦逼运维的真实写照了...)。

于是抽空看了下百度站长平台,至少看到了2个新消息:

①、百度已全面支持https网站,并倡导说使用https会优先收录;

②、主动推送将逐步取代实时推送,实时向百度推送新数据。

WordPress发布文章主动推送到百度,加快收录保护原创

对于第一点,个人认为现阶段https不管是从兼容性还是从速度上还是差强人意的。尤其是一些免费的SSL证书,虽然可以让我等屌丝网站瞬间提高逼格,营造一种高大上的赶脚。但是国内其他几家搜索引擎貌似还不能支持https的收录,所以我个人建议可以暂时先观望一下,等技术和时机成熟再来实现整站https。

对于第二点,我第一时间想到的就是百度WordPress数据化结构插件—baidusubmit可以删除,但后面发现其实这2个机制是可以共存的,不过依过往经验来看,如果同时使用,我个人建议关闭百度的数据化结构插件的实时推送功能,避免重复推送通知,造成收录困扰!

一、主动推送

先来看下百度对于主动推送的一些说明:

主动推送:最为快速的提交方式,建议您将站点当天新产出链接立即通过此方式推送给百度,以保证新链接可以及时被百度收录。

主动推送支持多种途径:比如curl 、post、php以及ruby等。而且支持一次性提交多条网站页面地址,不过每个站点每天可推送的次数暂时限制在50次。

使用主动推送功能会达到怎样效果?
①、及时发现:可以缩短百度爬虫发现您站点新链接的时间,使新发布的页面可以在第一时间被百度收录
②、保护原创:对于网站的最新原创内容,使用主动推送功能可以快速通知到百度,使内容可以在转发之前被百度发现

——摘自百度官方:原文地址

二、PHP代码

①、WrodPress 通用方式【推荐使用】

补充于2015-07-03:不经意看到张戈博客之前写的发布文章同步新浪微博的代码,突然发现原来都可以更简单!因为 WordPress 本来就存在支持 POST 或 GET 方法的 WP_Http 类,这样一来妈妈再也不用担心我的主机是否支持这个支持那个了!

先摘一段来自鱼叔的相关描述:

在 PHP 中发起 HTTP 请求并不是很难,有很多种方法:使用 fopen() 函数,使用 CURL 扩展,使用文件操作函数如 fsockopen() 和 fwrite()等,但是问题是各种方法所依赖的服务器的配置把不同,有些服务器可能无法支持,不过 WordPress 自身开发了新的 API WP_Http 使得 WordPress 在所有环境下都非常容易发起 HTTP Request。

PHP 类:WP_Http

WordPress 2.7 开始引入了一个新的 PHP Class:WP_Http(在 wp-includes 目录 http.php 文件中)。这个 Class 的强大之处是它会检测服务器的情况,选择最好的方法去实现 HTTP 请求,所以我们自己无须去检测 HTTP 扩展,fopen(),是否存在curl_init() 函数,这个 Class 都会包办这些检测。

                  -------摘自我爱水煮鱼《使用 WP_Http 在 WordPress 中发起 HTTP Request》

简单的修改一下之前的代码,即可轻松搞定:

 

②、curl_init 方式

WordPress发布文章主动推送到百度的代码非常简单,只要稍微修改一下张戈博客之前分享的《WordPress发布文章自动同步到新浪微博(带特色图片)》中的代码即可搞定:

 

③、file_get_contents 方式

鉴于有个别站长反馈代码添加后,发布或更新文章,自定义栏目中都不会出现我们期望的baidusubmit,我要他们检查 token 和域名,也反馈是正确的,直到我亲自给一个站长 Debug 时才发现是他主机的 curl_exec()函数被禁用了!既然这个函数都不能用了,那代码也肯定无法正常推送了!

于是,我额外写了一个普遍支持的 file_get_contents 方式,代码如下:

Ps:file_get_contents 的运行效率应该是略低于curl的,不过就推送一条数据,就基本没有差别啦!如果你使用第一种方式没有成功,那么就试试 file_get_contents 方式吧!

③、代码部署

从上面选好合适的代码后(推荐①),先打开百度官方页面:http://zhanzhang.baidu.com/linksubmit/index,获取你网站的专属的 token 值,替换到代码中的 "xxxxxxxxx"(Ps:域名已更新为动态变量,无需另外更改)。

WordPress发布文章主动推送到百度,加快收录保护原创

最后将修改后的代码添加到主题目录下的 functions.php 函数模板并保存。

现在发布新文章,文章地址将会被主动推送到百度。被成功推送的文章,将自动出现如下自定义栏目:

WordPress发布文章主动推送到百度,加快收录保护原创

从而避免代码重复推送的尴尬,如果你需要更新文章再次推送数据,那么删除或修改这个自定义栏目即可再次被推送。

Ps:虽然,主动推送的各种方法都支持一次推送多条数据,从我个人的经验来看,对于老文章没必要再次推送,频繁推送容易导致百度“翻脸”!

三、其他说明

用心思考的童鞋,应该可以看出百度的目的应该是为了获取文章准确的发布时间,这一项改进很明显就是为了配合之前百度取消快照之后,新增的“文章发布时间"的改动:

WordPress发布文章主动推送到百度,加快收录保护原创

我个人认为,之前百度应该是通过分析文章中的时间戳来确认原创文章的发布时间。但是时间戳是可以作弊的,而百度蜘蛛的抓取也不是及时的,这样就带来了文章是否真实原创的争议!比如张戈博客发布一篇文章,蜘蛛还没来得及抓取,就被大站转走而且还不带来源链接,就会出现一种情况:大站的蜘蛛抓取频繁,第一时间就抓到了转载的文章,认为是原创,而真正的原创却由于后抓取被蜘蛛认为是伪原创!是个人都要吐血了吧?

现在有了主动推送就好多了,高质量原创文章发布,第一时间就会推送到百度,从而告知了最准确的原创来源,从而杜绝了抄袭者和原创者出现角色互换的尴尬!还在使用老版 baidusubmit 插件的朋友,可以赶紧试试张戈写的代码了!

最新补充:早上不经意看到百度官方推荐文章,果然不出我所料:

新的主动推送工具最大的亮点就是“快”。
这个工具直接将链接推送给百度,而原来的工具推送的是结构化数据,需要百度进一步解析和内部排序。天下功夫,唯快不破。高手对决中,1微秒决定胜负。快速推送带来的好处是两方面的:一是及时发现,可以缩短百度爬虫发现您站点新链接的时间,使新发布的页面可以在第一时间被百度收录;二是保护原创,对于网站的最新原创内容,使用主动推送功能可以快速通知到百度,使内容可以在转发之前被百度发现。

新的主动推送工具第二个特点就是“人性化”。
首先是密匙的人性化,同一个帐号下所有站点的密匙相同。这一点对于一个绑定了多个子域名的大站来说,是个福音,不用为每个子域名写个推送程序,节省时间成本和技术成本。第二个人性化是返回数据人性化,返回数据包含返回码和message,推送完后能立即知道推送结果,而老的工具推送后要登录后台才能查看推送结果。

另外,使用这个插件时必须确保推送的是最新、高质量的网页链接。
  刚才说新工具的最大亮点是快,之所以能快,是因为跳过了正常抓取时的好几个步骤。百度这样做,是希望能更加快速的抓取到高质量的网页。如果一个网站经常推送一些老的、垃圾页面的链接,百度会很生气的,会认为网站辜负了他的信任,直接后果是百度不再信任这个网站的推送,导致工具失效,是否有其它更恶劣的后果,比如降低网站评价,这个还有待进一步观察。所以,使用这个工具时一定要注意,老的、低质量的网页链接不要推送了。(Ps:为了测试我的代码,我连续推送了十几次老文章,也是醉了。。。)

然后这位仁兄还给出了主动推送和实时推送的对比清单:WordPress发布文章主动推送到百度,加快收录保护原创

不久,我又在百度官方WIKI看到了相关文章,已更新到上文当中 。

转载于:https://www.cnblogs.com/kenshinobiy/p/7350761.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_712609.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网站提速-缓存技术(4)

缓存技术 memcached基本概念 Memcached是danga的一个项目,最早是为LiveJournal 服务的,最初为了加速 LiveJournal 访问速度而开发的,后来被很多大型的网站采用。 官方网站: www.danga.com 和 memcached.org Memcached是一个高性能的分布式的…

2007最优秀的CSS网站设计

很多人不知道的是,我同样是 Best Web Gallery 和 N.Design Studio“背后”的人. 2006年,我创建了Best Web Gallery,作为我发现的最好的 CSS and Flash 网站的收藏.我非常高兴这个项目让我有机会是我的设计思想与主流保持一致。在过去的一年里&#xff0c…

html提高搜索排名优化,网站搜索排名,为什么很难提升,该如何提高?

在日常SEO工作中,SEO人员经常遇到的一个问题就是:做了很多优化工作,自己的网站搜索排名,几乎是纹丝不动,很难提升,这对于SEO新人,是一项心态的考验,很多人开始焦急,不知道…

高性能网站建设之减少Http连接数

关于CSS背景图合并工具,请大家参看随笔:Css背景图合并工具功能增强(V0.1) 在对大访问量网站进行性能优化时,其中有一点是尽量减少http连接数,道理很明了,减少了单个PV的http连接数,…

ASP.NET网站还是ASP.NET Web应用程序?

当我在Visual Studio中启动新的ASP.NET项目时,可以创建一个ASP.NET Web应用程序,也可以创建一个ASP.NET网站。 ASP.NET Web应用程序和ASP.NET网站之间有什么区别? 我为什么要选择一个? 根据我使用的Visual Studio版本&#xff0…

php有ssm框架吗,SSM框架-企业门户网站-1-工程构建

刚入职一个星期,现在才有时间开始这个框架的博客,我自己接的项目,第一次拿商业项目开源,大神们可能看着会觉得这不怎么样吧,其实我上线的项目是PHP写的,我只是在这个项目的基础上,改为了SSM框架…

asp.net三层架构制作新闻管理_为什么使用PHP制作网站?

现在网站制作可以使用多种语言。为什么我们选择PHP进行网站制作? 北京东浩联创科技有限公司.是一家高端网站制作公司,在业界处于领先地位。本文东浩联创的小编告诉大家我们为什么使用PHP进行网站制作?它的优势在哪里?1&#xff0c…

linux php 网站计数器,PHP图形数字计数器的实现

php图形数字计数器,是现在网站中经常使用的方法,它的基本功能是针对单个用户而言,登录网站后计数器的值加一,用户刷新网页,计数器的值不会增加。这一点功能的实现是利用session来实现的,当用户登录时&#…

OSChina 初十二乱弹 ——网站都挂了,巴叔被安排出去度假

2019独角兽企业重金招聘Python工程师标准>>> Osc乱弹歌单(2018)请戳(这里) 【今日歌曲】 莱布妮子 :分享Scott Shields的单曲《Short Change Hero》 《Short Change Hero》- Scott Shields 手机党少年们想…

【大学生必备神器网站】免费论文下载、免费2T网盘、各类免费课程、在线高数引擎...收藏了4年的宝藏学习网站最全の整理推荐!

前言: 大学大学,就是“大不了自己学”。四年大学本科经历让我认识到一个道理:大部分情况下,人与人之间的差距就在于信息与资源上。互联网时代推崇“开源”与“自由”,但可惜的是,由于垃圾信息过剩&#xff…

复制加网站信息的javascript代码及对应的javascript阻止命令

复制加网站信息的javascript代码 代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns"http://www.w3.org/1999/xhtml"xml:lang"zh-cn…

这些小众又有趣的计算机自学网站,不再私藏了!

计算机的学习总少不了用“可视化”的方式去理解&#xff0c;今天推荐我收藏夹里相当不错的网站。 1. VisALgo - 数据结构和算法动态可视化 地址&#xff1a;https://visualgo.net/zh 网站提供不下20种经典的数据结构与算法可视化迭代过程&#xff0c;十分适合刚刚接触数据结构…

django搭建一个小型的服务器运维网站-查看和修改服务器配置与数据库的路由...

目录 项目介绍和源码&#xff1b; 拿来即用的bootstrap模板&#xff1b; 服务器SSH服务配置与python中paramiko的使用&#xff1b; 用户登陆与session; 最简单的实践之修改服务器时间&#xff1b;查看和修改服务器配置与数据库的路由&#xff1b; 基于websocket的实时日志实现&…

微软网站提供的8本英文原版书电子版

微软网站提供了8本英文原版书电子版。您可以到以下地址找到这8本书&#xff0c;进行免费的下载。 http://blogs.msdn.com/b/microsoft_press/archive/2011/03/03/ebooks-list-of-our-free-books.aspx?utm_contentem-orm-newsletters-msp-april-2011&utm_campaignNewslette…

15个使用 CSS3 制作的漂亮作品展示网站

今天分享的作品集网站有些特别&#xff0c;因为他们都是使用 CSS3 技术制作的。对于设计师来说&#xff0c;为了吸引注意力&#xff0c;作品集必须展示出你的能力&#xff0c;这有点像制作简历&#xff0c;要让人们看到你所擅长的&#xff0c;突出的部分&#xff0c;这是一次推…

或许是比力扣 leetcode 更好的选择?推荐两个编程算法宝藏网站

简介&#xff1a;虽然会有朋友吐槽 leetcode 题目过于简单&#xff0c;但也并不是人人都要去刷最难的题&#xff0c;比如把自己的练成信息学奥林匹克竞赛&#xff08;Olympiad in Informatics, OI&#xff09;的专业水平。 但是&#xff0c;信息学奥林匹克竞赛的学习是成体系的…

ROBOTS.TXT在SEO优化中的运用(ROBOTS.TXT SEO优化实战)

2019独角兽企业重金招聘Python工程师标准>>> 豆瓣网的robots.txt中有Crawl-delay、Visit-time、Request-rate&#xff0c;好多人搞不清楚这是什么含义&#xff0c;因为平时大家用的最多的是User-agent和Disallow。不会写的新手们可以参考下http://www.douban.com/ro…

【强烈推荐】如何解决JQuery类Post方式的跨域问题 - 空山雪林通用模块设计工作室 - ITeye技术网站...

【强烈推荐】如何解决JQuery类Post方式的跨域问题 - 空山雪林通用模块设计工作室 - ITeye技术网站【强烈推荐】如何解决JQuery类Post方式的跨域问题 博客分类&#xff1a;核心代码片段jQueryjsonFlashXML工作在很多应用场景&#xff0c;利用JQ的getJSON解决跨域问题是首选&…

22号大更新网站大面积降权的原因分析

22号端午节是个美好的日子&#xff0c;但对于众多站长来说&#xff0c;这一天并不快乐&#xff0c;因为百度算法发生改变导致很多网站降权了&#xff0c;特别是一些老站从排名很好&#xff0c;一夜回到解放前&#xff1b;很多站长认为是百度内部数据错误导致的&#xff0c;三天…

好久没弄网站多皮肤了

最近项目中用户有对网站提多皮肤的需求&#xff0c;想在不同的节假日&#xff08;季节&#xff09;给网站换不同的皮肤&#xff0c;比如国庆日、中秋节、端午节、建党节、春节、春天、夏天、秋天、冬天等等。主要技术就是用程序&#xff08;前台脚本和后台模板引擎均可&#xf…