django+apache配置网站的robots.txt和sitemaps等理静态文件

news/2024/5/9 16:50:31/文章来源:https://blog.csdn.net/iteye_17686/article/details/81954072

当你的网站已经在公网上正常上线后,为了能被搜索引擎很好的收录网站结构,就必须主动向搜索引擎提供robots.txt和sitemap.xml,

先来看看什么是robots.txt和 sitemap.xml吧,以下摘自“维基百科”

http://zh.wikipedia.org/zh-cn/Sitemaphttp://zh.wikipedia.org/zh/Robots.txt

robots.txt

维基百科,自由的百科全书

robots.txt(统一小写)是一种存放于网站根目录下的ASCII编码的文本文件,它通常告诉网络搜索引擎的漫游器(又称网络蜘蛛),此网站中的哪些内容是不能被搜索引擎的漫游器获取的,哪些是可以被(漫游器)获取的。 因为一些系统中的URL是大小写敏感的,所以robots.txt的文件名应统一为小写。robots.txt应放置于网站的根目录下。如果想单独定义搜索引擎的漫游器访问子目录时的行为,那么可以将自定的设置合并到根目录下的robots.txt,或者使用robots元数据。

Robots.txt协议并不是一个规范,而只是约定俗成的,所以并不能保证网站的隐私。注意Robots.txt是用字符串比较来确定是否获取URL,所以目录末尾有和没有斜杠“/”这两种表示是不同的URL,也不能用"Disallow: *.gif"这样的通配符。

其他的影响搜索引擎的行为的方法包括使用robots元数据:

<meta name="robots" content="noindex,nofollow" />

这个协议也不是一个规范,而只是约定俗成的,通常搜索引擎会识别这个元数据,不索引这个页面,以及这个页面的链出页面。

XML网站地图 sitemaps

sitemaps是站点管理员向搜索引擎爬虫公布站点可被抓取页面的协议,sitemap文件内容必须遵循XML格式的定义。每个URL可以包含更新的周期和时间、URL在整个站点中的优先级。这样可以让搜索引擎更佳有效的抓取网站内容。

Google引入了Google网站地图使得网页开发者可以发布整个站点的链接列表。其基本假设是一些站点拥有大量动态页,而这些页面只能通过表单和用户登录来访问。网站地图文件可以被用来指引网络蜘蛛如何找到这类页面。Google、MSN、Yahoo以及Ask都支持网站地图协议。

由于MSN、Yahoo、Ask以及Google使用同样的协议,因此拥有一个站点地图可使这四个最大的搜索引擎的页面信息保持最新。网站地图不保证所有的链接可被抓取,而被抓取了也不一定会做成索引。但是,一个站点地图仍然是使一个搜索引擎获得你整个站点信息的最保险的方式。

那么我们现在以django+apache为架构的网站 (www.souapp.com)搜应用 为例,将robots.txt和sitemap.xml提交给google作为工作任务。

1、首先你要登录google网站管理员工具页面:

https://www.google.com/webmasters/tools/home?hl=zh-CN

添加 www.souapp.com,并验证你是网站的拥有者。

2、在“网站配置”栏目下的“抓去工具的权限”为robots.txt配置详细。

如图所示,robots.txt文件位置默认访问 http://www.souapp.com/robots.txt,当然你也可以手工制定URL。

3、在“网站配置”栏目下的“Sitemaps”为sitemap.xml配置详细。

如图所示,sitemap.xml文件位置默认访问 /sitemap.xml,当然你也可以手工定制URL,我自定义设置为/media_alias/sitemap.xml

============================================================

下面我们着重讲解,robots.txt和sitemap.xml放置在网站根目录的路径配置操作:

1、Django网站的静态文件js,image,css路径配置

我把网站使用到的css js jpg png txt等文件全部放在网站下的media目录下
要在页面中能够引用到要做如下的配置

在setttings.py中加入
#设置静态文件路径
STATIC_PATH ='/var/www/media/'

在urls.py中的配置
先导入 from django.conf import settings
接着在urlpatterns 中加上
(r'^media_alias/(?P<path>.*)$', 'django.views.static.serve',{'document_root': settings.STATIC_PATH}),

最后在html页面中就可以这样用了
<link rel="stylesheet" type="text/css" href="/media_alias/common.css" />
<script type="text/javascript" src="/media_alias/jquery.js" />
<image src="/media_alias/souapp.png" />

2、Apache静态文件路径配置

注意:你的apache要安装mod_python ,详细参考:Ubuntu 8.04 mod_python Config

LoadModule python_module /usr/lib/apache2/modules/mod_python.so

找到/etc/apache2/httpd.conf文件,配置如下:

<VirtualHost *:80>
<Location "/">
SetHandler python-program
PythonPath "['/var/www']+sys.path"
PythonHandler django.core.handlers.modpython
SetEnv DJANGO_SETTINGS_MODULE souapp.settings
#PythonOption django.root /
PythonDebug On
#PythonInterpreter souapp
</Location>

Alias /media_alias/ /var/www/media/

Alias /robots.txt /media_alias/robots.txt
Alias /sitemap.xml /media_alias/sitemap.xml

<LocationMatch "/.(jpg|gif|png|txt|ico|pdf|css|jpeg)$">
SetHandler None
</LocationMatch>

这样一来,访问http://www.souapp.com/sitemap.xml,和http://www.souappp.com/robots.txt,实际上是apache直接访问的/var/www/media/的sitemap.xml和robots.txt

3、robots.txt和 sitemap.xml的生成

在google网站管理员工具页面的引导下,你会很快生成 robots.txt并下载下来,放到你的网站目录里,而sitemap.xml的生成请参考

Django生成网站的sitemap.xml

搜应用网(www.souapp.com)致力于移动互联网-手机应用服务的提供,为广大手机用户努力营造一个分享手机应用、充分享受移动生活给我们带来无限生活乐趣的环境,为此我们深信移动互联网是手机用户个性化、分享化的个人时代;目前我们提供的服务主要针对于Android手机系统。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_744947.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

大型高性能网站的十项规则

<!-- 来源 --> 在我们公司ChinaNetCloud&#xff0c;见 过多种不同类型的网站和系统&#xff0c;有好也有差。其中有些系统拥有良好的服务器/网络架构&#xff0c;并且进行了合理的调整和监控 &#xff1b;然而一般的系统都会有安全和性能上的 问题&#xff0c;不能良好运…

souapp:网站图片找不到,指向默认图片显示

如果你的网站上显示的图片不存在&#xff0c;总不能给访问者显示一个个小的图片吧&#xff0c;下面我们以www.souapp.com(搜应用网)为例&#xff1a; 当用户鼠标onMouseOver,"搞笑铃声-精选集合2"这个APP的时候&#xff0c;上面应该显示该APP的详细信息以及screensho…

souapp搜应用网:放弃IE浏览器的用户,你的网站能做到吗?

这几天调试souapp.com的页面&#xff0c;感觉chrome,firefox,ie总不可能达到一致的页面效果&#xff0c;非常之崩溃&#xff0c;chrome和firefox还不错了&#xff0c;最可气的就是那个IE&#xff0c;不仅页面布局乱七八糟&#xff0c;而且很多JS代码在IE下不支持&#xff0c;报…

php网站漏洞检测对sql注入漏洞防护

近日&#xff0c;我们SINE安全对metinfo进行网站安全检测发现&#xff0c;metinfo米拓建站系统存在高危的sql注入漏洞&#xff0c;攻击者可以利用该漏洞对网站的代码进行sql注入攻击&#xff0c;伪造恶意的sql非法语句&#xff0c;对网站的数据库&#xff0c;以及后端服务器进行…

www.souapp.com(搜应用网)推出了中文版和英语版网站

www.souapp.com(搜应用网) 在Google Android Market 的开发者们的强烈要求下&#xff0c;最近推出了中文版和英语版网站&#xff0c;希望中国开发者和国外开发者能够在souapp.com上推广自己的APP&#xff0c;并且根据souapp.com提供的APP统计&#xff0c;为自己的下一款APP的开…

中国5G普及为何会领先美国:建站更便宜,频谱更适合

据国外媒体报道&#xff0c;虽然美国无线运营商正在美国城市相继推出5G商用服务。但中国计划在明年年底之前在全国所有地级以上城市提供5G商用服务&#xff0c;然后在全国其他地区推广开来。中国无线运营商凭借更低的基站建设成本、更优质的5G频谱资源、更便捷的设备设施共享在…

[实用]推荐一些非常棒的前端网站

前言 有时候&#xff0c;提高效率的办法&#xff0c;比如收藏一些好用的网站。这么多年下来&#xff0c;收藏夹里面躺着一些好用的网站&#xff0c;来掘金的时候&#xff0c;收获了很多知识&#xff0c;这时候准备回馈点东西给你们。 ❝ 如果部分国外网站访问不了的&#xff0…

360浏览器收藏夹_你缺的不是收藏而是藏经阁——聊聊那些极好用的收藏夹整理插件/网站...

收藏是不少小伙伴的习惯&#xff0c;就我而言&#xff0c;收藏夹收藏的网址已经有535条&#xff0c;但我相信比我多的绝对是大有人在。虽然我们经常都会收藏&#xff0c;可是我们真的懂得收藏吗&#xff1f;或许&#xff0c;你缺的不是收藏而是一个懂你的藏经阁~~~第一步——从…

sqlserver 每天一行_学 SQL Server 我最常逛的 5 个网站

点击蓝色“有关SQL”关注我哟加个“星标”&#xff0c;天天与10000人一起快乐成长很多读者加我微信&#xff0c;问的问题都很类似&#xff0c;“有没有好的书可以推荐”&#xff0c;“我是上班族&#xff0c;没有时间看书&#xff0c;有没有快速入门、进阶的视频推荐&#xff1…

建网站怎么建mysql数据库_数据库的建立(mysql数据库怎么建表)

第一步&#xff1a;创建数据库使用CREATE DATABASE 语句&#xff1b;CREATE DATABASE 用于创建数据库&#xff1b;实例&#xff1a;希望创建一个名为"my_first_db"的数据库。create database my_first_db;执行语句后&#xff0c;你将会在左侧的mysql信息列表中&#…

前端学习网站

一、非技术类 1、V2EX&#xff1a;https://www.v2ex.com/ 程序员撕X大本营&#xff0c;很多业界热门撕X都是从这个论坛吵起来的&#xff0c;适合吃瓜 2、IT 公论&#xff1a;https://itgonglun.com/archive/2015/#e-2918 音频节目&#xff0c;已经停更几年了&#xff0c;但有…

html蔚蓝网注册页面,如何在网站中添加手机短信验证码注册功能?

原标题&#xff1a;如何在网站中添加手机短信验证码注册功能&#xff1f;这个功能大家都非常熟悉了&#xff0c;就不废话了&#xff0c;直接入正题!下面以使用榛子云短信为例:1. 首先注册一个榛子云账号&#xff0c;注册地址: http://sms_developer.zhenzikj.com/zhenzisms_use…

50 多个提高前端人效率的工具、网站和书籍整理

本文包含了在线编译&#xff0c;在线编辑、实用工具、可视化工具、各种前端电子书等50多个网站&#xff0c;快放到你的收藏夹吃灰吧 如果你看到最后了&#xff0c;记得给我一个免费的赞哦 在线编译&#xff08;编辑&#xff09;、playground JS 代码混淆 www.jsfuck.com/ 嗯…

70+ 实用工具网站分享(建议收藏!)

前言 大家好&#xff0c;我是HoMeTown&#xff0c;好的工具&#xff0c;可以帮助我们大幅提高编程效率&#xff0c;今天给大家分享一下我平时收集到的一些工具&#xff0c;目录已经分好了。 JavaScript JavaScript教程 通俗易懂的JavaScript教程 传送门 ES6教程 阮一峰大佬…

大型互联网网站割接方案

某国内大型网站改版&#xff0c;线上运行中的网站是由A部门负责&#xff0c;改版工作和以后的维护工作由B部门负责&#xff0c;我担任B部门改版项目的负责人。 前期的架构设计中面临两点问题&#xff1a; 1. A部门和B部门的技术框架和架构设计是不一样&#xff0c;且改版…

大型互联网网站的告警系统及策略

1. web服务进程的监控 监控web服务器上的web进程是否存活&#xff0c;内存&#xff0c;cpu,网卡数据上报到监控服务器 2. web服务依赖的业务逻辑服务的监控 Web服务调用业务逻辑服务成功和失败都上报到监控服务器&#xff0c;设置监控阀值&#xff0c;低于阀值告警…

如何使用Zend Framework、Smarty、Ajax创建一流的网站

如何使用Zend Framework、Smarty、Ajax创建一流的网站“读完本书后&#xff0c;我发现自己对Web开发和MVC模式的理解都已经今非昔比……强烈推荐此书&#xff01;”——Amazon.com“……一部极富启发性的PHP实战指导书&#xff0c;业界专家充分演示了如何使用Zend Framework、S…

Axure RP一键生成网站结构图

转自&#xff1a;https://jingyan.baidu.com/article/67508eb4decbe59ccb1ce441.html 详见上面的百度百科。 需要补充的如下图。

海洋工作室——网站建设专家:FTP服务与FTP软件基础知识

共享下载站&#xff0c;即我们所说的FTP服务器&#xff0c;FTP是英文File Transfer Protocol的缩写&#xff0c;中文意思是文件传输协议。用户通过FTP协议能够在两台联网的计算机之间相互传递文件&#xff0c;它是互联网上载递文件最主要的方法。FTP服务器是互联网上提供FTP 提…