SEO之sitemap.xml

news/2024/5/12 15:11:38/文章来源:https://blog.csdn.net/dangelrose/article/details/83519319

Sitemap 简介:Sitemap 即网站地图一般有两种,一种是给用户看的 ,主要格式为HTML,主要是呈现网站各个栏目的分布,这里不做讨论。

 

     而对于SEOer 来说,要关注的是给搜索引擎看的网站地图 。Sitemap(sitemap.xml) 可以方便快速的告知搜索引擎网站上有哪些可供抓取的页面 。在Sitemap里,你可以列出你网站中需要蜘蛛索引的网址,以及该页面上次更新的时间、更改的 频率以及相对于网站上其他页面的重要程度等,以便搜索引擎可以更加智能地抓取网站。

使用sitemap.xml 并不能保证全部网页被搜索引擎收录,但它能保证让网页更快更及时 的收录。目前Google,雅虎,微软都支持最新的sitemap协议(sitemap 0.9)。

       Sitemap 特别适用于以下情况:

1.网站内含有动态内容;

2.网站内存在flash或JS等蜘蛛无法正常抓取的页面;

3.链向新网站新页面的链接不多;

4.网站内大量数据相互之间没有很好的链接。

       Sitemap 的作用:

1.告诉蜘蛛网页的更新频率(网页内有些页面可能几个月不更新,我的确是每天更新,根据不能得情况设定不同的更新频率,一方面是减轻服务器压力, 另一方面是减轻蜘蛛的压力,让它检索最主要的内容)

2.告诉蜘蛛修改时间(告诉搜索引擎哪些是最新修改的);

3.告诉蜘蛛网页的相对重要性(比如:主页的 相对重要性为1.0 ,栏目页的相对重要性为0.8 ,内容页相对重要性则为0.5 。这个优先级只是说明特定网址相对于您网站上其他网址的重要性,并不会影响 网页在搜索结果中的排名。)。

Sitemap 0.9协议内容

Sitemap 协议格式由XML  标记组成。Sitemap需使用UTF-8 编码,且内容需要经过实体转译。(实体转译主要是将URL中“&”符号转译成“&”等。 ) 

Sitemap 必须:

以 <urlset> 开始标记作为开始,以 </urlset> 结束标记作为结束;在 <urlset> 标记中指定协议标准;每个网址包含一个<url> 条目作为 XML 父标记;在每个 <url> 父标记中包含一个 <loc> 子标记条目;Sitemap 中的所有网址都必须来自于同一个主机。

sitemap 示例:

sitemap.xml

XML标记定义说明:

<urlset> 必需,用以指明协议。

<url> 必需,每个网址的父标记。

<loc> 必需,网页地址,需有“http://”开始,如为目录以“/”结束。

<lastmod> 可选,页面最后修改时间,需要使用W3C标准时间格式 。

<changfreg> 可选,页面修改频率,可选参数为(always,hourly,daily,weekly,monthly,yearly,never )。 “always”应用于每次访问而改变的文档,“never”值则应用于存档类的页面。应该注意的是蜘蛛只是将修改频率作为参考而不是命令。对标记为 “hourly”页面的抓取频率可能低于每小时一次,而对标记为“yearly”页面的抓取频率可能高于每年一次。抓取工具也可能会定期抓取标记为 “never”的网页。

<priority> 可选,网页的重要性。此重要性是相对于此网站的其他页面而言的网,有效值范围从 0.0 到 1.0,该值不会影响您的网页与其他网站上网页的比较结果。一个网页的默认值0.5。为网页指定重要性并不会影响网址在搜索引擎结果页上的排名。搜索引擎 在同一网站上选择不同网址时会使用此信息,因此,可以使用此标记增加最重要的网页在搜索索引中显示的可能性。另,为网站中的所有网址都指定高重要性并不会 带来什么好处,因为优先级重要性是相对的,只用于自己网站网页间的比较。

使用 Sitemap 索引文件(对多个 Sitemap 文件进行分组)

Sitemap 文件包含的网址不得超过 50,000 个,并且文件不得超过 10MB。可以使用 gzip 压缩 Sitemap 文件,以减少带宽要求,但是解压缩后的 Sitemap 文件不得超过 10MB。如果要列出 50,000 个以上的网址,就需要创建多个 Sitemap 文件。

Sitemap 索引文件的 XML 格式与 Sitemap 文件的 XML 格式非常相似。

Sitemap 索引文件必须:以 <sitemapindex> 开始,以 </sitemapindex> 结束;每个 Sitemap 包含一个<sitemap> 条目作为 XML 父标记;每个 <sitemap> 父标记包含一个 <loc> 子标记条目;可选的 <lastmod> 标记同样适用于 Sitemap 索引文件。

注意:Sitemap 索引文件只能指定与其位于同一网站的 Sitemap,与 Sitemap 一样,Sitemap 索引文件也必须为 UTF-8 编码。

XML Sitemap 索引示例

sitemap_index

sitemap 索引XML标记定义

<sitemapindex> 必须,声明协议内容。

<sitemap> 必须,每个sitemap的父标签。

<loc> 必须,sitemap地址。

<lastmod> 可选,sitemap的更新时间。通过最近修改的时间,搜索引擎抓取只检索索引中的 Sitemap 子集,也就是说,抓取工只检索某个特定日期之后修改的 Sitemap。通过这一递增的 Sitemap 提取机制,可以快速发现超大型网站上的新网址。

 参考网站 1.http://www.google.com/support/webmasters/bin/topic.py?topic=8476  2.http://www.sitemaps.org/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_838624.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SiteMap Maker v1.01 网站地图生成器

主要特点介绍&#xff1a; 很多人的网站在Google&#xff0c;百度&#xff0c;雅虎等各大搜索引擎收录非常少&#xff0c;而且长期收录不增长或者增长很慢。 这主要是因为&#xff0c;搜索引擎没有足够的信息爬行到这个网站的每一个页面。这大大影响了搜索引擎为网站带来…

We7荣获“政府网站群建设最佳产品奖”

8月23日&#xff0c;由中国信息化推进联盟、中国计算机行业协会、中国计算机报社等国家信息化领域权威机构和权威媒体共同组织开展的“第四届中国行业信息化奖项评选活动暨2012中国行业信息化颁奖盛典”在北京国宾酒店隆重举办。来自行业信息化领域的500余位企业代表、政府领导…

ASP.NET网站开发实用代码

网站制作时显示的服务器资料 Environment.TickCount /60000//获取计算机运行时间inttick Environment.TickCount /60000;lblTic.Text (tick /60).ToString() "小时 "(tick %60).ToString() "分钟";intrem Convert.ToInt32(Environment.WorkingSet) /1024; …

网站进度条完美解决方案

对网站的进度条感兴趣开始于使用360安全卫土时&#xff01;由于这个软件的绿色进度条&#xff0c;我感觉这个软件很新奇、很神秘、技术含量很技高、细节性东西做得不错&#xff0c;用四个字来概括就是“焕然一新”。其实没使用这个软件之前&#xff0c;我觉得这东西并没不是那么…

生成网站缩略图代码(C#)

这几天博客园都在讨论这个&#xff0c;看了How to take screenshot (thumbnail) of a web site with ASP.NET 2.0?&#xff0c;根据VB.NET代码&#xff0c;搞出来一个C#版本的&#xff0c;看看效果还不错,百度不能正常显示&#xff0c;其他几个大站&#xff08;google,sohu)显…

一个图标搜索网站

http://www.iconlet.com/ 里面的图标很全&#xff0c;你需要的几乎都能找到&#xff0c;并且是 png 的哟&#xff0c;做平面的这下爽啦&#xff01; 贴几张图&#xff0c;馋馋大家&#xff1a; 对于我个人来说&#xff0c;我非常喜欢上面的这种风格…

开发视频网站,asp.net视频文件转换.fla格式

最经公司有一个小项目需要把视频转换成FLASH文件&#xff0c;效果就是像用户注册youku网一样&#xff0c;自己可以视频上传&#xff0c;转换成flash格式播放。 苦于以前没有做过&#xff0c;于是马上搜索了相关的文章&#xff0c;看了 http://www.cnblogs.com/xiucai/ 和 http…

ASP.NET2.0实现网站的自动升级

网站的自动升级主要是要实现从一台服务器上下载某些文件到本服务器上&#xff0c;然后对下载下来的文件进行更新等操作。比如&#xff0c;现在有服务器A,服务器B和客户端C。作为COM公司开发的产品DIV网站系统被安装到服务器B上&#xff0c;而它的更新设置及更新文件则在服务器A…

谈谈wordpress网站固定链接URL如何设置好?

有不少站长不知道wordpress网站固定链接URL如何设置好&#xff0c;今天福利吧就来仔细给你分析一下。很多人已经都知道了wordpress默认的网址形式是带问号的&#xff0c;这种网址对SEO 来说很不好&#xff0c;是动态的网址&#xff0c;影响搜索引擎的排名和收录。 那么wordpres…

【seo】网页开发 代码优化 1

URL要静态&#xff0c;不能是动态或者伪静态。网站图片 img标签添加alt和title属性。 Title“这张图片的内容”&#xff0c;比如这是一张人物图片&#xff0c;那么就是title“人物名” Alt “XXX-建中集团”&#xff0c;这里的XXX指人、物名或栏目名。例子同上alt“人物名-建…

【seo】网页开发 代码优化 2

超链接<a> 目前<a>标签隐藏在CSS里&#xff0c;不能被搜索引擎抓取&#xff0c;应直接放在前端<div>代码中&#xff0c;不要放在样式里&#xff0c;也不要用任何方式隐藏。 参考案例&#xff1a;百度百科 CSS CSS放在统一的样式文件中&#xff0c;需要使用的…

【seo】网页开发 代码优化 3

TDK A.首页 title:中商碳素研究院-铝及铝用碳素企业探索者 Keywords:中商碳素研究院&#xff0c;碳素&#xff0c;铝用碳素&#xff0c;有色金属 Description&#xff1a;中商碳素研究院总部位于上海&#xff0c;是有色金属、铝及铝用碳素行业国内首家互联网科技、工业、贸易…

【seo】网站优化工具 - 5118 入门教程

网站工具&#xff1a; https://www.5118.com/ 1、 打开官网 2、安装浏览器插件 3、开始SEO的工作

盘点:144个免费学习网站,全网最全资源合集

亲测整理144个免费学习网站&#xff0c;强烈推荐其中44个&#xff0c;正文多图预警。 先看目录&#xff1a; 一、国内MOOC类网站&#xff08;多综合类&#xff09; 小科普&#xff1a;MOOC&#xff08;massive open online courses&#xff09;&#xff0c;即大型开放式网络课…

大型网站之分布式会话管理

为什么80%的码农都做不了架构师&#xff1f;>>> 随着网站的功能和用户越来越多&#xff0c;单机器服务部署的Web应用已经不能再支持了。这时候就需要优化或调整目前的架构&#xff0c;具体怎么优化&#xff0c;或先优化哪部分&#xff0c;这取决于网站的具体情况&a…

15个优秀的PHP免费在线学习网站

PHP是一种功能强大的服务器端脚本语言&#xff0c;旨在帮助Web开发人员快速开发动态页面。 本文为您介绍15个优秀的PHP免费在线学习网站&#xff0c;希望对您学习PHP有所帮助。 01. The official PHP website – PHP Manual 02. W3 Schools PHP Tutorial 03. Tizag.co…

图文解说Win7系统机器上发布C#+ASP.NET网站

1. 概述 在一台干净的Win7机器上发布ASP.NET网站需要准备的有&#xff1a; a) .NET Framework 环境 b) 数据库 c) IIS 互联网信息服务 d) 待发布的网站代码 其中.NETFramework环境一般安装了VS2008 或者VS2010都会自带&#xff0c;也可以下载独…

子目录下的文件如何include网站根目录下的文件

2019独角兽企业重金招聘Python工程师标准>>> ###问题 目录./aaa/bbb/ccc下的index.php需include网站根目录下的conn.php。 解答思路 ###问题归结于如何获取网站的根目录。 $dir $_SERVER[DOCUMENT_ROOT]; //获取到网站的根目录 include($dir.conn.php); //成功将根…

Java学习免费网站

Java学习免费网站论 给一些喜欢自学的&#xff0c;且口袋与我一样轻的小伙伴介绍一个学习网站&#xff01;&#xff01;&#xff01; 第一种 &#xff0c;阿里云 第二种 java学习网站地址 https://how2j.cn/k/number-string/number-string-string/324.html?p182240