django+apache配置网站的robots.txt和sitemaps等理静态文件

news/2024/5/9 12:41:40/文章来源:https://blog.csdn.net/changemyself/article/details/5952707

当你的网站已经在公网上正常上线后,为了能被搜索引擎很好的收录网站结构,就必须主动向搜索引擎提供robots.txt和sitemap.xml,

 

先来看看什么是robots.txt和 sitemap.xml吧,以下摘自“维基百科”

http://zh.wikipedia.org/zh-cn/Sitemap   http://zh.wikipedia.org/zh/Robots.txt

 

robots.txt

 

维基百科,自由的百科全书

robots.txt(统一小写)是一种存放于网站根目录下的ASCII编码的文本文件,它通常告诉网络搜索引擎的漫游器(又称网络蜘蛛),此网站中的哪些内容是不能被搜索引擎的漫游器获取的,哪些是可以被(漫游器)获取的。 因为一些系统中的URL是大小写敏感的,所以robots.txt的文件名应统一为小写。robots.txt应放置于网站的根目录下。如果想单独定义搜索引擎的漫游器访问子目录时的行为,那么可以将自定的设置合并到根目录下的robots.txt,或者使用robots元数据。

Robots.txt协议并不是一个规范,而只是约定俗成的,所以并不能保证网站的隐私。注意Robots.txt是用字符串比较来确定是否获取URL,所以目录末尾有和没有斜杠“/”这两种表示是不同的URL,也不能用"Disallow: *.gif"这样的通配符。

其他的影响搜索引擎的行为的方法包括使用robots元数据:

<meta name="robots" content="noindex,nofollow" />

这个协议也不是一个规范,而只是约定俗成的,通常搜索引擎会识别这个元数据,不索引这个页面,以及这个页面的链出页面。

 

 

XML网站地图 sitemaps

sitemaps是站点管理员向搜索引擎爬虫公布站点可被抓取页面的协议,sitemap文件内容必须遵循XML格式的定义。每个URL可以包含更新的周期和时间、URL在整个站点中的优先级。这样可以让搜索引擎更佳有效的抓取网站内容。

Google引入了Google网站地图使得网页开发者可以发布整个站点的链接列表。其基本假设是一些站点拥有大量动态页,而这些页面只能通过表单和用户登录来访问。网站地图文件可以被用来指引网络蜘蛛如何找到这类页面。 Google、MSN、Yahoo以及Ask都支持网站地图协议。

由于MSN、Yahoo、Ask以及Google使用同样的协议,因此拥有一个站点地图可使这四个最大的搜索引擎的页面信息保持最新。网站地图不保证所有的链接可被抓取,而被抓取了也不一定会做成索引。但是,一个站点地图仍然是使一个搜索引擎获得你整个站点信息的最保险的方式。

 

 

那么我们现在以django+apache为架构的网站 (www.souapp.com) 搜应用 为例,将robots.txt和sitemap.xml提交给google作为工作任务。

 

1、首先你要登录google网站管理员工具页面:

https://www.google.com/webmasters/tools/home?hl=zh-CN

 

 

添加 www.souapp.com,并验证你是网站的拥有者。

 

2、在“网站配置”栏目下的“抓去工具的权限”为robots.txt配置详细。

如图所示,robots.txt文件位置默认访问 http://www.souapp.com/robots.txt,当然你也可以手工制定URL。

 

 

3、在“网站配置”栏目下的“Sitemaps”为sitemap.xml配置详细。

如图所示,sitemap.xml文件位置默认访问 /sitemap.xml,当然你也可以手工定制URL,我自定义设置为/media_alias/sitemap.xml

 

 

============================================================

下面我们着重讲解,robots.txt和sitemap.xml放置在网站根目录的路径配置操作:

1、Django网站的静态文件js,image,css路径配置

 我把网站使用到的css js jpg png txt等文件全部放在网站下的media目录下
要在页面中能够引用到要做如下的配置

在setttings.py中加入
#设置静态文件路径
STATIC_PATH ='/var/www/media/'

在urls.py中的配置
先导入 from django.conf import settings
接着在urlpatterns 中加上
(r'^media_alias/(?P<path>.*)$', 'django.views.static.serve',{'document_root': settings.STATIC_PATH}),

最后在html页面中就可以这样用了
<link rel="stylesheet" type="text/css" href="/media_alias/common.css" />
<script type="text/javascript" src="/media_alias/jquery.js" />
<image src="/media_alias/souapp.png" />

 

2、Apache静态文件路径配置

 

注意:你的apache要安装mod_python ,详细参考: Ubuntu 8.04 mod_python Config

 

LoadModule python_module /usr/lib/apache2/modules/mod_python.so

 

找到/etc/apache2/httpd.conf文件,配置如下:

 

<VirtualHost *:80>
 <Location "/">
  SetHandler python-program
  PythonPath "['/var/www']+sys.path"
  PythonHandler django.core.handlers.modpython
  SetEnv DJANGO_SETTINGS_MODULE souapp.settings
  #PythonOption django.root /
  PythonDebug On
  #PythonInterpreter souapp
 </Location>
 
Alias /media_alias/ /var/www/media/

Alias /robots.txt /media_alias/robots.txt
Alias /sitemap.xml /media_alias/sitemap.xml

 

<LocationMatch "/.(jpg|gif|png|txt|ico|pdf|css|jpeg)$">
    SetHandler None
</LocationMatch>

 

这样一来,访问http://www.souapp.com/sitemap.xml,和http://www.souappp.com/robots.txt,实际上是apache直接访问的/var/www/media/的sitemap.xml和robots.txt

 

3、robots.txt和 sitemap.xml的生成

 

在google网站管理员工具页面的引导下,你会很快生成 robots.txt并下载下来,放到你的网站目录里,而sitemap.xml的生成请参考

Django生成网站的sitemap.xml

搜应用网(www.souapp.com)致力于移动互联网-手机应用服务的提供,为广大手机用户努力营造一个分享手机应用、充分享受移动生活给我们带来无限生活乐趣的环境,为此我们深信移动互联网是手机用户个性化、分享化的个人时代;目前我们提供的服务主要针对于Android手机系统。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_804832.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

souapp:网站图片找不到,指向默认图片显示

如果你的网站上显示的图片不存在&#xff0c;总不能给访问者显示一个个小的图片吧&#xff0c;下面我们以www.souapp.com(搜应用网)为例&#xff1a; 当用户鼠标onMouseOver,"搞笑铃声-精选集合2"这个APP的时候&#xff0c;上面应该显示该APP的详细信息以及screensho…

将网站发布到互联网

一、发布前的准备工作 1、一台Linux(CentOS/Ubuntu)服务器。 2、一款web服务器&#xff08;Nginx/Apache/Tomcat&#xff09; 3、一个属于自己的独立域名&#xff08;cn/com/org/...&#xff09; 二、服务器的购买和配置 1、服务器的类型&#xff1a;1&#xff09;Linux&#x…

souapp搜应用网:放弃IE浏览器的用户,你的网站能做到吗?

这几天调试souapp.com的页面&#xff0c;感觉chrome,firefox,ie总不可能达到一致的页面效果&#xff0c;非常之崩溃&#xff0c;chrome和firefox还不错了&#xff0c;最可气的就是那个IE&#xff0c;不仅页面布局乱七八糟&#xff0c;而且很多JS代码在IE下不支持&#xff0c;报…

www.souapp.com(搜应用网)推出了中文版和英语版网站

www.souapp.com(搜应用网) 在Google Android Market 的开发者们的强烈要求下&#xff0c;最近推出了中文版和英语版网站&#xff0c;希望中国开发者和国外开发者能够在souapp.com上推广自己的APP&#xff0c;并且根据souapp.com提供的APP统计&#xff0c;为自己的下一款APP的开…

网站中图片的相对路径与绝对路径

1、相对路径 网站中加载图片所用到的相对路径&#xff0c;相对路径是以网页所在位置为参考的。 ../代表上一级目录 src"../../photo/1.png"; src"images/1.jpg"; 相对路径不但用于寻找图片还可以用于寻找网页&#xff1a; <a href"../myweb2/2.htm…

IOS目前比较不错的推广网站

序号 名称 网址 姓名 QQ 地址 邮箱 1 爱apps www.iapps.im 黄奇 328774787 上海 2 网易 http://m.163.com/iphone/ 李思萌 2964203 北京 3 威锋网 http://www.weiphone.com/ aenea 1224255960 深圳 4 搞趣 www.gao7.com 岳凌涵 2218526141 福州…

github python 画图_熬了一夜!我用Python做了一个网站,帮小姐姐生成漫画头像

公众号关注 “菜鸟学Python”设为 “星标”&#xff0c;每天看趣味Python干货&#xff01;对于动漫&#xff0c;大家一定都不陌生&#xff0c;小编周围的不少单身码农都是动漫迷。小编也是一个资深动漫迷&#xff0c;动漫里面有好多漂亮的小姐姐&#xff0c;比如斗破苍穹的美杜…

app开发者维权网站正式上线,真正关注开发者生存现状的媒体网站(souapp.com搜应用)

app开发者目前在行业中的弱势问题日益突出&#xff0c;主要来自4个方面的侵权问题&#xff1a;1、app开发者提交APP在软件商店&#xff0c;经常会遇到软件商店强制指定某家广告SDK的嵌入方才能够上架的霸王条款&#xff0c;例如:国内的机锋市场&#xff1b;此外&#xff0c;APP…

网站截图抓取工具:ubuntu+xvfb+CutyCapt,可以实现高效网页缩略图,支持flash显示

找了几个工具都不是很理想&#xff0c;最后通过实验大功告成&#xff0c;下面是具体步骤&#xff1a; 1、环境搭建&#xff1a; 操作系统:ubuntu sudo ap-get install build-essential sudo apt-get install xvfb sudo apt-get install xfs xfonts-scalable xfonts-100dpi su…

网站备案/该网站暂时无法访问

今天新的域名买了阿里云解析&#xff0c;和云服务器ecs 部署好了几小时后提示了这个 https://help.aliyun.com/knowledge_detail/36938.html阿里云help文档显示 备案服务号怎么获得&#xff1f; 备案服务号介绍&#xff1a; 您在购买阿里云ECS、SLB、弹性web托管、建站市场产品…

作品-网站-[原生开发]云鸽信息网

基于ThinkPHP开发 电脑端网址&#xff1a;http://www.yungexinxi.com 手机端网址&#xff1a;http://www.yungexinxi.com 开发性质&#xff1a;二次开发 网站类型&#xff1a;拍卖、商城、个人博客 转载于:https://www.cnblogs.com/phpyangbo/p/6087990.html

网站流量日志数据分析系统(1)

1&#xff0e; 点击流数据模型 1.1&#xff0e; 点击流概念 点击流&#xff08;Click Stream&#xff09;是指用户在网站上持续访问的轨迹。这个概念更注重用户浏览网站的整个流程。用户对网站的每次访问包含了一系列的点击动作行为&#xff0c;这些点击行为数据就构成了点击流…

网站流量日志数据分析系统(模块开发----数据仓库设计)

1&#xff0e; 维度建模基本概念 维度建模(dimensional modeling)是专门用于分析型数据库、数据仓库、数据集市建模的方法。数据集市可以理解为是一种"小型数据仓库"。 维度表(dimension) 维度表示你要对数据进行分析时所用的一个量,比如你要分析产品销售情况, 你可以…

新闻网站项目django--分类页

models.py 相关模型&#xff1a; # 分类表 class Category(models.Model):name models.CharField(max_length40, nullFalse) # 分类名def __str__(self):return self.name# 文章表 class Article(models.Model):title models.CharField(max_length100, nullFalse) # 标题in…

初始阶段网站架构(一)

(译) 1、初始阶段 大型网站都是从小型网站发展而来&#xff0c;网站架构也是一样&#xff0c;从小型网站逐步演变而来的。小型网站没有多少人访问&#xff0c;只需一台服务器就绰绰有余&#xff0c; 这个是网站架构如图&#xff1a; 单一服务器中&#xff1a;应用程序、数据库、…

什么是伪静态?网站伪静态有什么作用?

经常听说动态页面和静态页面&#xff0c;那么伪静态页面是什么呢&#xff1f;搞清楚这个概念前&#xff0c;我们先要了解一下什么是动态页面&#xff1f;什么是静态页面&#xff1f; 动态页面&#xff1a;用ASP、PHP、JSP、ASP.net、Perl、或CGI等编程语言制作&#xff0c;不是…

【精华】PHP网站验证码不显示的终结解决方案

PHP网站验证码不显示&#xff0c;这个是个很基础的PHP问题了&#xff0c;不过有点时候会比较让开发者比较头疼了。很多解决方案仅仅考虑到gd2&#xff0c;却忽略了另外一个很重要的因素了&#xff0c;相信在了解本教程之后&#xff0c;验证码不显示基本上就不算什么问题了。下面…

HTML作品——家乡旅游网站

文章目录[隐藏] 为通道旅游做贡献 为通道旅游做贡献纯静态页面HTML作品&#xff0c;当时开HTML课程&#xff0c;自己纯手工制作的。其实是个半成品&#xff0c;还有很多东西没介绍完&#xff0c;如果有喜欢旅游的朋友&#xff0c;欢迎与我联系&#xff0c;共同制作旅游网站顺便…

网站源码——爱的小窝

文章目录[隐藏] 一款记录情侣生活的&#xff0c;基于PHP的网站 一款记录情侣生活的&#xff0c;基于PHP的网站安装教程&#xff1a;上传到空间或者服务器进行安装默认账号密码&#xff1a;admin 123456管理员可添加男方与女方的账号密码管理页面&#xff1a;url/admin蓝奏网盘行…

舔狗日记随机展示网站源码

最近各种日记挺火的 什么 舔狗、保安、小偷。。。主要是在首页使用了js&#xff0c;首页添加了一个“再来一段”按钮&#xff0c;无需刷新即可实现显示新的内容。至于舔狗日记内容&#xff0c;存放在index.js文件里&#xff0c;可以自己收集添加。蓝奏网盘演示地址行云博客 - 免…