浅谈SEO优化

news/2024/5/20 2:32:03/文章来源:https://blog.csdn.net/moses_binson/article/details/89393733

前段时间帮朋友搬家,被问到会不会写python爬虫,我说不会(真的不会)。但是去图书城充数的时候还是大概瞄了一下有关python爬虫的书籍的,有各种各样的python爬虫框架,Scrapy、PySpider、Crawley、Grab等等各种框架,大概就是各种爬虫爬取的数据内容不同,然后根据爬虫控制器、解析器、资源库的技术不同进行分类。绕的有点远,之所以说到上面的事情是因为今天谈到的SEO与爬虫有密不可分的关系。其实其他的语言,PHP,Java,c++也都可以开发爬虫,由于python语言的特点,社区比较完整,有各种现成的框架,涉及到运行速度,开发效率,开发成本等问题,而且写爬虫是一边写,一边测试,测试不过再改改,这个过程用 python 写起来最方便,所以听到的python爬虫比较多。

SEO的目的就是为了把网站排到搜索引擎前面,提升曝光频率,通过关键词精准定位高质量客户,是一种营销手段,也能提升企业形象。打个比方,去百度搜索web,由于SEO做的好,某培训机构官网做到了第一页前面的位置,网被点开的概率就很大,促成招生的概率就大了,三页以后的内容都懒得看。

百度很大一部分收入来自于广告,就是百度竞价排名,给钱然后把你的网站放到前面去,不过由于莆田系事件的缘故,所有竞价广告被要求标注广告二字,包括360和搜狗等浏览器。这个缘故,似乎SEO的地位一下就提高了不少,因为用户不喜欢点广告内容,百度在中国是用户占有量第一的搜索引擎(半壁江山),也就导致竞价排名贵。

百度蜘蛛

说SEO不得不提百度搜索引擎的百度蜘蛛,百度蜘蛛是百度搜索引擎的一个自动程序。它的作用是访问收集整理互联网上的网页、图片、视频等内容,然后分门别类建立索引数据库,使用户能在百度搜索引擎中搜索到您网站的网页、图片、视频等内容。

百度蜘蛛工作机制

构建原理

搜索引擎构建一个调度程序,来调度百度蜘蛛的工作,让百度蜘蛛去和服务器建立连接下载网页,这样一个开始数据采集的过程。这个过程是上面提到的控制器的工作,控制器启动线程调用蜘蛛爬虫爬取网页,给多线程中的各个蜘蛛爬虫线程分配工作任务。目前的搜索引擎普遍使用广布式多服务器多线程的百度蜘蛛来达到多线程的目的。

运行原理

深度优先和权重优先,百度蜘蛛抓页面的时候从起始站点(即种子站点指的是一些门户站点)是百度优先抓取是为了抓取更多的网址,深度优先抓取的目的是为了抓取高质量的网页,这个策略是由调度来计算和分配的,百度蜘蛛只负责抓取,权重优先是指反向较多的页面的优先抓取,这也是调度的一种策略,一般情况下网页抓取抓到40%是正常范围,60%算很好,100%是不可能的,当然抓取的越多越好。

怎么引导蜘蛛收录

       1、网站的更新频率

  网站的内容需要经常定时更新高价值的内容,能优先抓取。在网站优化中,创建内容要有频率,因为蜘蛛爬行事有策略的,网站创建内容越频繁,蜘蛛爬行的频率会越频繁,所以更新的频率可以提高抓取的频率。搜索引擎的用户也是喜欢新的内容,这也是针对用户体验做的必要设计。

        2、内容质量:
         网站内容质量对于网站来说非常重要,这关系到用户来到我们网站,能不能找到自己所需要的答案,能不能让用户满意。搜索引擎是为用户服务的,因此,当我们的网站内容原创度多,质量高,并且可以解决用户问题时,那么蜘蛛就会提高抓取频次。

  3、网站受欢迎程度

  网站的欢迎程度,是指我们的用户体验。对呀用户体验好的网站,百度蜘蛛会优先录取。那这里有人会问,我们该怎么提高用户体验呢?其实很简单,首先是网站的颜色搭配和页面布局必须合理,另外重要的个是广告,必须避免太多的广告,不要让广告遮住正面的内容,否则百度会判定你的网站用户体验非常糟糕。

        4、页面深度:
        想要蜘蛛抓取的页面在网站首页是否有入口,如果有入口存在的话,就更能方便页面被抓取和收录。
当我们进行网站数据分析时,如果发现蜘蛛抓取频次低,停留时间短,我们就可以通过以上方法对网站进行相应的优化,来提升蜘蛛对我们网站的爬取收录。

  5、优质的入口

  优质的入口主要是指网站的外链,优质的站点follow(跟踪)的站点,优先抓取。现在百度对外部链接做了个很大的调整,对于垃圾外链,百度已经过滤的非常严格。基本上在论坛上发外链或者留言板之类的外链,百度都会在后台过滤。但是真高质量的外链,对于排名和抓取来说事很重要的。

  6、安全记录优异站点,优先抓取

  网络安全越来越重要,对于个经常受到攻击(被黑)的网站,是能严重危害用户的。所以,SEO优化过程中要注意网站的安全性。

  7、历史抓取效果好的

  百度不管是排名还是蜘蛛的爬行,历史记录非常重要。这好比个人的历史记录样,如果之前作弊过。那会留下污点。网站亦是如此。在优化网站中切记不要作弊,旦留下污点会降低百度蜘蛛对站点的信任,影响抓取网站的时间和深度。要坚持更新高质量的内容,非常的重要。

  8、服务器稳定,优先抓取

  从15年开始,百度对于服务器的稳定性因素权值做了个很大的提升。服务器稳定包括稳定和速度两个方面。速度越快的服务器,植株抓取的效率越高。服务器越稳定,蜘蛛抓取的连通率越高。另外有个高速稳定的服务器,对于用户体验上来说也是件非常重要的事情。

等...等各种因素

网站内部SEO分为两大部分:网站结构框架的优化页面优化

网站结构框架的优化

大多数SEO工作者常常把优化重点放在页面上,比如关键词分布、标题标签等等,但是却因此忽略了网站最核心的框架优化。一个良好的网站框架能让SEO效果事半功倍,让页面的优化更加有条理性。网站结构合理,页面深度大,百度蜘蛛更喜欢“黑洞”一样的神秘区域。

页面优化

HTML的不同标签在SEO优化中的权重分数 :

内部链接文字: 10 分

标题title: 10 分

域名: 7 分

H1,H 2 字号标题: 5 分

每段首句: 5 分

路径或文件名: 4 分

相似度(关键词堆积): 4 分

每句开头:1. 5 分

文本用法(内容): 1 分

title属性: 1 分 (不是<title>, 是A标签中title属性)

加粗或斜体: 1 分

alt标记:0. 5 分

Meta描述(Description属性):0. 5 分

Meta关键词(Keywords属性):0. 05 分

上面的站内优化规则会导致vue.js这种数据驱动框架构建的单页面应用非常不利于SEO。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_876352.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2021新手建站-宝塔一键部署WordPress(上)

2021新手建站-宝塔一键部署WordPress&#xff08;上&#xff09; 1.前期准备 服务器域名 2.部署宝塔 演示Centos系统下的宝塔部署过程&#xff0c;如果你是其他系统&#xff0c;可以去宝塔官网查看对应的系统如何部署安装&#xff01; 远程登录到你的服务器&#xff08;需要…

【js】多种方式查看网站的cookie

1.F12在浏览器的控制面板console中输入document.cookie查看&#xff1a; 2.在谷歌浏览器的开发者工具Application中找到cookie查看&#xff1a; 3.在浏览器的设置中找到&#xff0c;已谷歌浏览器为例&#xff0c;在谷歌浏览器的地址栏输入&#xff1a; chrome://settings/conte…

Java Web开发 基于HttpServlet的用户登录网站 实例

分享一下我老师大神的人工智能教程&#xff01;零基础&#xff0c;通俗易懂&#xff01;http://blog.csdn.net/jiangjunshow 也欢迎大家转载本篇文章。分享知识&#xff0c;造福人民&#xff0c;实现我们中华民族伟大复兴&#xff01; 一个简单的小例子&#xff0c;基于httpser…

阿里云上部署webservice或者网站,服务器本身测试可以整成使用,但是在其他机器上调用时找不到网页或者webservice

阿里云上部署webservice或者网站&#xff0c;服务器本身测试可以整成使用&#xff0c;但是在其他机器上调用时找不到网页或者webservice 前一段时间做项目时需要用到webservice&#xff0c;开始时在自己的本地机器上创建了webservice,然后在vs2012中发布了这个webservice 然后…

iis部署网站(asp.net或者wcf)出现HTTP 错误 404.17 - Not Found 请求的内容似乎是脚本,因而将无法由静态文件处理程序来处理。

首先参考这个&#xff1a; http://blog.csdn.net/xuwei_xuwei/article/details/36895193 https://q.cnblogs.com/q/32443/ 其次&#xff1a; http://www.zhixing123.cn/net/41765.html 还有看下配置iis的时候有没有 都配置过了基本没问题

发布网站到本地IIS出错

错误&#xff1a; win10以前系统以管理员方式打开cmd执行 c:\windows\microsoft.net\framework64\v4.0.30319\aspnet_regiis.exe -i win10以管理员方式打开cmd执行 dism /online /enable-feature /featurename:IIS-ISAPIFilter dism /online /enable-feature /featurename:II…

12个免费学习编程的网站

摘要&#xff1a;无论想学什么,也无论出于什么目的想学,都需要你保持好奇心。但是作为刚想入门的新手&#xff0c;面对眼前海量的信息&#xff0c;或许根本不知道从哪里开始。想学习编程&#xff1f;这里有12个提供免费编程课的网站推荐给你。 曾几何时&#xff0c;编程对极客来…

网站部署到IIS上如何进行调试

在一个网站成功部署后&#xff0c;有时候可能会遇到一些错误&#xff0c;但又不能一眼看出错误源&#xff0c;如果能在源程序里下断点进行调试就好了&#xff0c;这样就能准确的找出错误代码。 下面就跟大家说说如何在一个已经部署了的网站上进行断点调试&#xff08;前提 有网…

【技巧】去哪找高清免费素材?这些资源网站必须收藏!

经常有同学问找素材和看创意的网站&#xff0c;今天就给大家介绍几个&#xff0c;素材免费且好用。 ① picjumbo 网址&#xff1a;https://picjumbo.com/ 美丽的免费照片 为高分辨率下载免费的图片&#xff0c;背景和图像&#xff0c;用于个人和商业用途 ② 01资源网 网址&…

10个超强英语学习资源网站,学霸们都在用!

想知道学霸们是怎么炼成的吗&#xff1f; 一起来看看躺在学霸电脑收藏夹的10个高档学习网站&#xff0c;用好它们&#xff0c;你也可以成为高手&#xff01; 1、TED 适用人群&#xff1a; 学霸&#xff0c;思想者 主要特点&#xff1a; 以专业、深度思考话题见长 网站简介&am…

找2021考研资料?这些超强资源网站必须知道!

&#xff08;1&#xff09;爱课程&#xff1a; 网址&#xff1a;http://www.icourses.cn/home/ 爱课程是教育部、财政部“十二五”期间启动实施的“高等学校本科教学质量与教学改革工程”支持建设的一个高等教育课程资源共享平台&#xff0c;集中展示“中国大学视频公开课”和…

【简历模板素材】制作简历,找简历模板?这几个网站全部搞定!

今天给大家推荐三个比较好用的制作简历&#xff0c;找简历模板的网站&#xff0c;可以在线制作并下载&#xff0c;也可以直接找简历模板套用&#xff01; 第一个推荐的网站就是——01资源网。 这是一个可以在线下载各种模板素材资源的网站&#xff0c;除了简历模板&#xff0…

冷知识!年薪百万的程序员常用的两个神网站分享!

今天分享两个程序员必逛的神网站。也是相对比较冷门的知识&#xff0c;两个网站都非常不错。 第一个是&#xff1a;No Design 网址&#xff1a;https://nodesign.dev 海量设计资源&#xff01;一秒搞定设计&#xff01; 网站上收集了许多十分便利的 UI 设计工具与设计资源&…

如何搭建一个像01资源网那样的付费资源网站?教你用wordpress快速搭建!

今天教大家如何快速创建一个属于自己的网站&#xff0c;永久免费&#xff01;并且支持各种类型&#xff0c;你可以创建一个简单的个人展示页&#xff0c;也可以创建一个好看的个人博客&#xff0c;甚至还可以创建一个电商网站&#xff0c;具体适用范围&#xff0c;大家可以自己…

5个考证神网站分享!涵盖初级中级会计/教师资格证/计算机二级/四六级各种资料!

对于各位考证的朋友&#xff0c;经常需要大量诸如网课类的学习资料&#xff0c;比如考初级中级会计资格证、教师资格证、计算机二级、四六级等等&#xff0c;那有哪些比较好的资源分享的网站呢&#xff1f; 下面我给大家介绍几个功能强大实用的网站&#xff0c;按照推荐优先级排…

通过IIS发布网站教程【十分钟完成一个网站发布】

工具&#xff1a;win10系统&#xff1b;一个完成的html文件&#xff08;或者是php、asp等&#xff09; 一、开启IIS服务 【控制面板】——【程序和功能】——【打开或关闭windos功能】&#xff0c;勾选以下截图服务&#xff0c;点击确定即可 二、局域网搭建网站 服务器电脑添…

VS2017 Web应用程序发布网站步骤

VS2017 Web应用程序发布网站详细步骤 一、web发布二、IIS安装三、IIS管理器发布网站四、出现的问题及其解决方法 一、web发布 1、用VS2017打开项目。 2、选中解决方案&#xff0c;点击鼠标 右 键&#xff0c;选择“清理解决方案”&#xff0c;然后再选择“重新生成解决方案”…

如何在Tomcat中发布网站

有静态发布和动态发布两种方式&#xff1a; 1. 静态发布网站&#xff1a; 直接在Tomcat安装目录下的webapps下创建网站文件夹即可&#xff08;可将网站内容放在该文件夹下~&#xff09; 2. 动态发布网站&#xff1a; 在Ecllipse的JavaEE视图中&#xff0c;右键选择->新建-…

iis发布网站时出现根目录文件解决方案

Window server 发布 vs打包的web应用时出现根目录文件 在web.config配置文件中 &#xff0c;modules 节点前加上 runAllManagedModulesForAllRequests“true”

Flask开发微电影网站(一)

1.用到的Flask知识 1.使用整形&#xff0c;浮点型&#xff0c;路径型&#xff0c;字符串型下正则表达式路由转化器2.使用GET与POST请求&#xff0c;上传文件&#xff0c;cookie获取与响应&#xff0c;404处理3.使用模板自动转义&#xff0c;定义过滤器&#xff0c;定义全局上下…