html搜索框_SEO搜索引擎的工作原理

news/2024/5/9 4:53:45/文章来源:https://blog.csdn.net/weixin_39559119/article/details/110705781

了解一下搜索引擎优化的原理,就会知道为什么要这样做了。

第一步:蜘蛛爬行轨迹

搜索引擎是通过一种特定规律的程序跟踪网页的链接,从一个链接爬到另外一个链接,像蜘蛛在蜘蛛网上爬行一样,所以被称为“蜘蛛”也被称为“机器人”。搜索引擎蜘蛛的爬行是被输入了一定的规则的,它需要遵从一些命令或文件的內容。

有些网站采用一些动态化的程序来做,结果甚至连页面源码上都看不到链接,这样的网站叫蜘蛛怎么爬?一个网站,就要通过环环相扣的链接让蜘蛛能完整地爬完,最好做个网站地图。

b895ddf20649e22562965984ca1cc531.png

第二步:抓取存储空间

搜索引擎是通过蜘蛛跟踪链接爬行到网页,并将爬行的数据存入原始页面数据库。其中的页面数据与用户浏览器得到的HTML是完全一样的。搜索引擎蜘蛛在抓取页面时,也做一定的重复内容检测,一旦遇到权重很低的网站上有大量抄袭、采集或者复制的内容,很可能就不再爬行。

所以新站,一定要做原创内容,如果是直接抄袭,那是不可取的,至少要进行深度伪原创才行。

44d7f530d11e1627e740744a438f2d84.png

第三步:预处理

搜索引擎将蜘蛛抓取回来的页面,进行各种步骤的预处理。

1、提取文字;

2、中文分词;

3、去停止词;

4、消除噪音;

5、正向索引;

6、倒排索引;

7、链接关系计算;

8、特殊文件处理;

除了HTML文件外,搜索引擎通常还能抓取和索引以文字为基础的多种文件类型,如PDF、Word、WPS、XLS、PPT、TXT文件等。我们在搜索结果中也经常会看到这些文件类型。

615b3db2855da5ed14bf94a98ad74833.png

第四步:排名

用户在搜索框输入关键词后,排名程序调用索引库数据,计算排名显示给用户,排名过程与用户直接互动的。但是,由于搜索引擎的数据量庞大,虽然能达到每日都有小的更新,但是一般情况下搜索结果都不会有什么太大的变动。搜索引擎的排名规则都是根据日、周、月阶段性不同幅度的更新。

有很多朋友以为我们使用搜索引擎进行搜索,是搜索到网站的实时性内容,其实不是的。如果是搜索实时性的内容,那搜索速度是非常慢的。

我们做SEO也要明白这一点,搜索引擎是预先抓取网页的,所以要让蜘蛛勤来网站抓取才行,而要蜘蛛喜欢,则就要每天准备新鲜内容。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_759988.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

We7荣获“政府网站群建设最佳产品奖”

8月23日,由中国信息化推进联盟、中国计算机行业协会、中国计算机报社等国家信息化领域权威机构和权威媒体共同组织开展的“第四届中国行业信息化奖项评选活动暨2012中国行业信息化颁奖盛典”在北京国宾酒店隆重举办。来自行业信息化领域的500余位企业代表、政府领导…

蜘蛛搜索引擎_搜索引擎蜘蛛为什么对网站不爬行呢?

在网站的优化过程中,很多优化人员都会遇到网站不经常收录,或者网站日志里都没有蜘蛛爬行的情况,如果新站遇到这样的问题还算正常,但是长期网站不被收录,网站就不会有排名和权重,更不会给企业带来更多的好处…

两青年更改源代码 “黑”十多家政府网站, 不是技术高,是政府网站安全性太低...

[提要] 两名19岁青年,利用后门程序先后侵入最高检察院等十多个政府机关的官方网站后台,更改网页源代码为其他网站牟利。公诉人提出,范某、文某侵入国家事务领域的计算机信息系统,多次利用后门程序非法控制非国家事务、国防建设和…

python plt画图_「figure」【Python】 【绘图】plt.figure()的使用 - seo实验室

figure 1.figure语法及操作 (1)figure语法说明 figure(numNone, figsizeNone, dpiNone, facecolorNone, edgecolorNone, frameonTrue) num:图像编号或名称,数字为编号 ,字符串为名称 figsize:指定figure的宽和高,单位为英寸; dpi参…

从零开始编写自己的C#框架(25)——网站部署

导航 1、关掉访问保护 2、发布网站 3、复制网站到服务器 4、添加新网站 5、设置网站访问权限 6、设置文件夹访问权限 7、控制可更新文件夹执行权限 8、设置“应用程序池”.net版本与模式 9、附加数据库 10、添加数据库访问用户 11、设置数据库链接 12、部署注意事项 对于网站的…

转载——网站转接支付宝解决方案

大型网上购物系统除了能让会员选择货到付款结账方式外,还应该提供一些更方便快捷的网上支付方式。如果网上商店没有足够的实力提供会员直接在网站中建立现金账户的功能,就可以将订单信息转接到支付宝,让会员从支付宝付款。当然就算会员可以在…

网站回到顶部按钮JS

为什么80%的码农都做不了架构师&#xff1f;>>> <script type"text/javascript"> $(function(){$(window).scroll(function(){$(window).scrollTop()>1000 ? $("#gotopbtn").css(display,).click(function(){$(window).scrollTop(0)…

让网站动起来!12款优秀的 jQuery 动画插件推荐

如今&#xff0c;大多数设计师和开发人员被要客户要求开发动态的网站。创造视觉震撼和醒目的动态网站是艰巨的任务&#xff0c;因为它需要大量的努力和创造力。在网络上有大量的工具和插件可用于创建网站动画。许多开发人员正在使用 HTML5 和 jQuery 提供的最新功能来创建创建和…

在网站中使用Bing Translator插件翻译文章。

前一阵子给项目增加了翻译的功能&#xff0c;用的是Bing Translator Widget,今天看见有个兄弟写自定义自己的博客&#xff0c;我就尝试着把这个插件加到了自己的博客中。还真的好用。大家先看下效果&#xff0c;觉得好的请继续往下看。方法很简单的。 方法&#xff1a; 1.先去官…

curl网站开发指南

文章转自&#xff1a;http://www.ruanyifeng.com/blog/2011/09/curl.html 作者&#xff1a; 阮一峰 日期&#xff1a; 2011年9月 4日 感谢 腾讯课堂NEXT学院 赞助本站&#xff0c;腾讯官方的前端课程 免费试学。 我一向以为&#xff0c;curl只是一个编程用的函数库。 最近才…

VS2012发布网站详细步骤

1、打开你的VS2012网站项目&#xff0c;右键点击项目》菜单中 重新生成一下网站项目&#xff1b;再次点击右键》发布&#xff1a; 2、弹出网站发布设置面板&#xff0c;点击<新建..>,创建新的发布配置文件&#xff1a; 输入你自己定义的配置文件名&#xff1a; 3、点击下…

MVC5 网站开发之四 业务逻辑层的架构和基本功能

业务逻辑层在Ninesky.Core中实现&#xff0c;主要功能封装一些方法通过调用数据存储层&#xff0c;向界面层提供服务。 目录 奔跑吧&#xff0c;代码小哥&#xff01; MVC5网站开发之一 总体概述 MVC5 网站开发之二 创建项目 MVC5 网站开发之三 数据存储层功能实现 MVC5 网站开…

一次网站迁移故障及分析

公司运营项目迁移&#xff0c;这个项目最重要的就是充值和让玩家能玩游戏&#xff0c;还有后台统计&#xff0c;就是类似支付宝这样的第三方平台的支付工具&#xff0c;由于涉及的到钱&#xff0c;所以上个月就做好迁移的准备&#xff0c;将代码和数据库都已转移完毕&#xff0…

网站应用微信登录功能接口开发指南

2019独角兽企业重金招聘Python工程师标准>>> 准备工作 网站应用 微信登录是基于OAuth2.0协议标准构建的微信OAuth2.0授权登录系统。 在进行微信OAuth2.在进行微信OAuth2.0授权登录接入之前&#xff0c;在微信开放平台注册开发者帐号&#xff0c;并拥有一个已审核通…

第一次担任项目经理从零开始架构自己的网站(二) 需求文档定稿,开始建表,建库(转)...

今天上午的半天时间&#xff0c;我们开发部一直都在和产品部门开会&#xff0c;扯皮。吐槽。最终砍掉了几个功能。产品的小姑娘对我说&#xff0c;你们第一期就做一个挂号支付的功能&#xff0c;后台就10几个页面&#xff0c;大多数是增删该查&#xff0c;还说22天不够用&#…

网站日志中的UserAgent分析

2019独角兽企业重金招聘Python工程师标准>>> 浏览器访问网站时&#xff0c;会提交UserAgent信息&#xff0c;里面包含操作系统/浏览器类型/渲染引擎&#xff0c;可以据此大致评估网站的客户端分布。特别是移动设备会在UserAgent中包含设备型号信息&#xff0c;所以有…

Azure Stack PaaS-网站(WebApp)背后是什么原理?

欢迎加入QQ群(423730487)&#xff01;4月9日在上海有一场线下活动&#xff0c;盆盆还有微软Azure Stack产品组专家会和大家一起分享技术&#xff0c;届时会在QQ群里直播哈。添加盆盆的微信(markpah)&#xff0c;我会把您拉到微信群。为什么要学习Azure Stack&#xff1f;因为这…

微网站|手机端html弹窗、弹层、提示框、加载条

layer mobile是为移动设备&#xff08;手机、平板等webkit内核浏览器/webview&#xff09;量身定做的弹层支撑&#xff0c;采用Native JavaScript编写&#xff0c;完全独立于PC版的layer&#xff0c;您需要按照场景选择使用。GitHub 官网&#xff1a;http://layer.layui.com/mo…

大型网站架构系列:负载均衡详解(3)

原文:大型网站架构系列&#xff1a;负载均衡详解&#xff08;3&#xff09;软件负载均衡概述Ngnix负载均衡Lvs负载均衡Haproxy负载均衡本次分享总结一、软件负载均衡概述 硬件负载均衡性能优越&#xff0c;功能全面&#xff0c;但是价格昂贵&#xff0c;一般适合初期或者土豪级…