Tailrank 网站架构(转)

news/2024/5/15 13:10:22/文章来源:https://blog.csdn.net/wbj0110/article/details/84538066

tailrank_logo.jpg

每天数以千万计的 Blog 内容中,实时的热点是什么? Tailrank 这个 Web 2.0 Startup 致力于回答这个问题。

专门爆料网站架构的 Todd Hoff 对 Kevin Burton 进行了采访。于是我们能了解一下 Tailrank 架构的一些信息。每小时索引 2400 万的 Blog 与 Feed,内容处理能力为 160-200Mbps,IO 写入大约在10-15MBps。每个月要处理 52T 之多的原始数据。Tailrank 所用的爬虫现在已经成为一个独立产品:spinn3r。

服务器硬件

目前大约 15 台服务器,CPU 是 64 位的 Opteron。每台主机上挂两个 SATA 盘,做 RAID 0。据我所知,国内很多 Web 2.0 公司也用的是类似的方式,SATA 盘容量达,低廉价格,堪称不二之选。操作系统用的是 Debian Linux 。Web 服务器用 Apache 2.0,Squid 做反向代理服务器。

数据库

Tailrank 用 MySQL 数据库,联邦数据库形式。存储引擎用 InnoDB, 数据量 500GB。Kevin Burton 也指出了 MySQL 5 在修了一些 多核模式下互斥锁的问题(This Bug?)。到数据库的JDBC 驱动连接池用 lbpool 做负载均衡。MySQL Slave 或者 Master的复制用 MySQLSlaveSync 来轻松完成。不过即使这样,还要花费 20% 的时间来折腾 DB。

其他开放的软件

任何一套系统都离不开合适的 Profiling 工具,Tailrank 也不利外,针对 Java 程序的 Benchmark 用Benchmark4j。Log 工具用 Log5j(不是 Log4j)。Tailrank 所用的大部分工具都是开放的。

Tailrank 的一个比较大的竞争对手是 Techmeme,虽然二者暂时看面向内容的侧重点有所不同。其实,最大的对手还是自己,当需要挖掘的信息量越来越大,如果精准并及时的呈现给用户内容的成本会越来越高。从现在来看,Tailrank 离预期目标还差的很远。期待罗马早日建成。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_848117.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

好玩的网站 可以实时看到任意航班的实时情况 位置 高度

周末放松一下,介绍二个网站,可以看到任意航班的实时情况 位置 高度,如果自已做飞机到某地旅游或商务办公时,可以试玩一下,感觉好像自已在开飞机啊。。。1. http://tianyan.baidu.com/sky  百度天眼&…

网站的高性能架构

什么叫高性能的网站? 两个网站性能架构设计方案:A方案和B方案,A方案在小于100个并发用户访问时,每个请求的响应时间是1秒,当并发请求达到200的时候,请求的响应时间将骤增到10秒。B方案不管是100个并发用户…

Nginx为目录或网站加上密码认证

有时我们会有这么一种需求,就是你的网站并不想提供一个公共的访问或者某些页面不希望公开,我们希望的是某些特定的客户端可以访问。那么我们可以在访问时要求进行身份认证,就如给你自己的家门加一把锁,以拒绝那些不速之客。实验环…

电商类网站类目体系

淘宝目前在线商品数超过 10 亿,如何精准的帮助用户找到他想要的商品呢?经过多年的探索,淘宝通过建立一套完整的类目属性体系,终于较好的解决了这一问题,今天就跟大家一起来谈谈淘宝的类目属性体系。 ▍一点点历史和架构…

设置火狐浏览器firefox模拟微信浏览器客户端,调试网站

首先,打开firefox的“附加组件”,安装“User Agent Switcher “。 第二、设置User Agent Switcher “,在浏览器右上角找到这个插件如图:,打开。 第三、在首选项里,加入下面的agent代码进去。 Mozilla/5.0 (…

5个你应该知道的建站平台

申请达人,去除赞助商链接如今在网络上有很多优秀的网站构建平台。根据你的需求,它们会提供不同的功能。然而,对于一个网站构建工具最重要的就是简单和友好。通过这些平台,开发者可以省去开发中的不少环节。 在本篇文章中&#xff…

一个对SEO友好的页面组成

创建一个SEO友好的页面并不是瞎蒙的,而是要了解哪些元素是搜索引擎需要检查的以及那些元素对影响排名。当然也要在站点中尽可能包含那些元素。如果你的站点没有任何链接和内容,就算meta标签放到正确的位置也不会起什么作用。 很容易过分注重于SEO的细节问…

编程语言和SEO

可能你会疏忽网站的编程语言。如HTML协议让你可以直接看到展现。PHP就是不同的协议了。大部分人考虑SEO基本都是考虑的是HTML。 但是我们编写网站中还用到了其他的语言,每种语言的SEO策略有些不同。 Javascript Javascript可以让web设计者做出各种动态的内容。但是j…

网络安全系列之十 万能密码登录网站后台

在登录网站后台时,有一个比较古老的“万能密码”漏洞,即利用一个我们精心构造的用户名,即使不用输入密码,也可以登录后台,其原理仍属于SQL注入的范畴。假设数据库中存放用户信息的表是admin,其中存放用户名…

网站首页的设计(转)

网站首页的设计是一件非常让人头痛的事。虽然她看上去很简单:产品经路随便从网站里拿点东西出来,堆出一个看上去靠谱的页面。也正因此,它往往非常麻烦:很多人都可以发表自己的见解,以致最终陷入到无尽的争执中。 首页的…

要访问本地IIS 网站,必须安装下列IIS组建: IIS6元数据库与IIS6配置兼容性ASP.NET

2019独角兽企业重金招聘Python工程师标准>>> 这个错误提示,我是在win7一个纯净系统上出现的,一般情况下是没有启用的关系,不是没有安装的关系,解决办法:打开控制面板\程序,打开或关闭windows功能…

discuz 网站空白怎么解决

2019独角兽企业重金招聘Python工程师标准>>> 问题一:前台打开空白,后台可以登陆。解决办法:1.登陆后台 http://域名/admin.php。 2.关闭所有的插件。3.更新缓存,即可解决。问题二:前台后台都是空白。解决办…

OpenCms创建网站的过程示意图——专用OpenCms人们刚开始学习

很多人听说过OpenCms,我知道它的强大,只需下载并安装,最后,我们看到了久违OpenCms,我们看到了它的简单的界面,喜悦之后,但难免困惑。如何用这个东西,我如何用它来网站,从…

站长,不要忘了你的网站是做什么的

随着互联网技术的发展,大大小小的实体行业进入到互联网,站点竞争进入了前所未有的“革命时代”,越来越多的站点了解并熟悉SEO技术,各个行业的站点流量拼抢到达了一种狂热。对搜索引擎是越来越了解并且熟悉其排名模式。如果今天你跟…

1.0 Python 学习网站

1. https://wizardforcel.gitbooks.io/python-doc-27-34/content/Text/2.2.html Python 中文内置函数 1. ★★★★★★ 【 Python 3 学习】 http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000 2.★★★★★http://www.crifan.com/fi…

如何进行seo

Hexo SEO 优化让你的博客在google搜索排名第一 刚刚建买了域名建了博客,发现在google,百度毛都搜不到,真是悲伤,后来才知道原来是要seo的,所以看了一些文章,然后自己也摸索了一下,终于在让自己的…

啦啦啦,,小网站大功能

1.极简图床:http://yotuku.cn 能够将本地图片地址生成一个网络地址 2.Smallpdf:https://smallpdf.com/ 实现不同文档类型的转换 3.iconfont阿里巴巴矢量图标库:http://www.iconfont.cn/plus 输入想要的图标的描述就可以筛选出相应的矢量图&am…

网站运维之JAVA-SSH框架数据同步问题

一、环境 SSH环境&#xff0c;查询用的是基于Hibernate的配置文件构建了一个SessionFactory&#xff0c;主要代码如下 public class HibernateUtil {private static ThreadLocal<Session> threadLocal new ThreadLocal<Session>();private static Configuration c…

软件架构设计学习总结(12):大型网站技术架构(六)网站的伸缩性架构

网站系统的伸缩性架构最重要的技术手段就是使用服务器集群功能&#xff0c;通过不断地向集群中添加服务器来增强整个集群的处理能力。“伸”即网站的规模和服务器的规模总是在不断扩大。 1、网站架构的伸缩性设计 网站的伸缩性设计可以分成两类&#xff0c;一类是根据功能进行物…

ASP.NET Core 网站发布到Linux服务器

长期以来&#xff0c;使用.NET开发的应用只能运行在Windows平台上面&#xff0c;而目前国内蓬勃发展的互联网公司由于成本的考虑&#xff0c;大量使用免费的Linux平台&#xff0c;这就使得.NET空有一身绝技但无法得到广大的施展空间&#xff0c;.NET平台被认为只适合开发企业内…