Tailrank 网站架构

news/2024/5/12 10:02:40/文章来源:https://blog.csdn.net/Fenng/article/details/81360627

tailrank_logo.jpg

每天数以千万计的 Blog 内容中,实时的热点是什么? Tailrank 这个 Web 2.0 Startup 致力于回答这个问题。

专门爆料网站架构的 Todd Hoff 对 Kevin Burton 进行了采访。于是我们能了解一下 Tailrank 架构的一些信息。每小时索引 2400 万的 Blog 与 Feed,内容处理能力为 160-200Mbps,IO 写入大约在10-15MBps。每个月要处理 52T 之多的原始数据。Tailrank 所用的爬虫现在已经成为一个独立产品:spinn3r。

服务器硬件

目前大约 15 台服务器,CPU 是 64 位的 Opteron。每台主机上挂两个 SATA 盘,做 RAID 0。据我所知,国内很多 Web 2.0 公司也用的是类似的方式,SATA 盘容量达,低廉价格,堪称不二之选。操作系统用的是 Debian Linux 。Web 服务器用 Apache 2.0,Squid 做反向代理服务器。

数据库

Tailrank 用 MySQL 数据库,联邦数据库形式。存储引擎用 InnoDB, 数据量 500GB。Kevin Burton 也指出了 MySQL 5 在修了一些 多核模式下互斥锁的问题(This Bug?)。到数据库的JDBC 驱动连接池用 lbpool 做负载均衡。MySQL Slave 或者 Master的复制用 MySQLSlaveSync 来轻松完成。不过即使这样,还要花费 20% 的时间来折腾 DB。

其他开放的软件

任何一套系统都离不开合适的 Profiling 工具,Tailrank 也不利外,针对 Java 程序的 Benchmark 用 Benchmark4j。Log 工具用 Log5j(不是 Log4j)。Tailrank 所用的大部分工具都是开放的。

Tailrank 的一个比较大的竞争对手是 Techmeme,虽然二者暂时看面向内容的侧重点有所不同。其实,最大的对手还是自己,当需要挖掘的信息量越来越大,如果精准并及时的呈现给用户内容的成本会越来越高。从现在来看,Tailrank 离预期目标还差的很远。期待罗马早日建成。

EOF

Google+

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_834222.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Yupoo! 的网站技术架构

又有机会爆料国内 Web 2.0 网站的架构了。这次是 Yupoo! 。非正式的采访了一下 Yupoo!(又拍网) 的创建人之一的 阿华(沈志华)同学,了解了一些小道消息。 作为国内最大的图片服务提供商之一,Yupoo! 的 Alexa 排名大约在 5300 左右。…

短信服务器不稳定怎么办,信息流广告_如何解决网站不稳定的苦恼

在建筑工地上线,网站不稳定后这是一个头疼的事情,除了有时不稳定的服务器,也有因为它的元素的优化,你今天教一些简单的方法来解决这种令人痛心的问题。首先:删除相应的关键字组关键字,有一种错误的看法是&a…

万网云服务器怎么上传网站吗,万网云服务器如何配置网站

想要用万网云服务器配置网站,但又不知道如何操作,那么万网云服务器如何配置网站呢?下面是学习啦小编收集整理的万网云服务器如何配置网站,希望对大家有帮助~~万网云服务器配置网站的方法进入主机管理控制台1登录万网,并进入我的主…

刚学编程的程序员必备这5大编程网站,你知道几个?

一个好的网站,就是程序员学编程的基地。 虽说新手程序员也许知道一些在线编程网站,但是质量上乘的编程网站又知道几个呢? 下面就来给大家推荐5个质量上乘的编程网站: 0、Leetcode LeetCode是大名鼎鼎的在线刷题网站,通过该网站的…

为什么程序员的个人网站博客一般都很丑?

为什么程序员的个人网站博客一般都很丑?说实话,在国内程序员的个人站UI、UE出彩的还是比较少的,依然还是90年代是web1.0的风格。 而且,作为前端程序员,什么交互设计,什么css3动效果,平常项目中的…

《高性能网站建设指南》读后随感

对于前端优化技术,我之前根据已经从 14 条增加到 34 条的 Exceptional Performance 做了一份笔记: Web 前端优化最佳实践之 内容篇Web 前端优化最佳实践之 Server 篇Web 前端优化最佳实践之 Cookie 篇Web 前端优化最佳实践之 CSS 篇Web 前端优化最佳实践…

python爬虫算一下demo大师网站的总创收

用python爬虫算一下demo大师网站的总创收,我会计算每个页面的上每个实例的下载次数和金额然后求总,免费的实例金额为0#!/usr/bin/env python #coding:utf-8import requests import json from bs4 import BeautifulSoupdef demodashi(url):response requ…

网站建设公司该不该把web前端外包出来!精辟

如今的网站建设公司其实过的并不好,一些建站平台、模板建站、仿站等都对网站定制造成了比较大的影响,网站建设公司如何降低用人成本、灵活的整合第三方资源成为度过“特殊时期”的重要手段,迎接下一波春天的到来。 网站建设公司该不该把前端…

网站运维之道 关于可用性

这是前一段时间投稿给《程序员》的一篇文章。标题中的"道"有些大了,您可以理解为"门道"的"道"。一家之言,妄自言道,诚可笑也。 什么是网站运维(Web operations) ?运维,绝不是某些人眼中…

网站运维之道 监控与报警机制

接上一篇的《关于可用性》,再谈一下监控与报警机制。 监控机制 定义了网站可用性指标,如何获取网站的可用值? 监控工具该粉墨登场了。 多数网站都会倾向于利用开源软件自行搭建监控平台。笔者一向认为,即使网站有一台服务器,也应…

网站运维之道 之容量规划

接上一篇《网站运维之道 监控与报警机制》,谈谈关于容量规划。 容量规划 有效的监控能够避免绝大多数问题的扩大化,但是还是做不到防患于未然。监控告警机制完善后,就需要着手考虑容量规划(Capacity Planning)的问题。 所谓的容量规划&#x…

手机之家网站架构–对话高春辉

这次去北京参加 CSDN SD 2.0 ,没发现高春辉的身影,原来是忙着做手机之家的架构升级呢。 从老高的近期工作总结中看到: 目前的技术状况是基于自行设计的 PHP 框架,跑在 PHP 5.2 MySQL 5.1 下,PHP 使用 Fastcgi 模式&am…

跨屏网  ,网站适配手机案例,适配前后对比图

跨屏网 ,网站适配手机案例,适配前后对比图 网站引用一句话JS代码适配 适配前 适配后 跨屏网自主开发一键适配跨屏平台,致力于为中小企业提供平价的手机适配服务。跨屏网为天悦网提供移动适配服务,网站适配后完美兼容手机端&#…

跨屏前后,网站添加一行代码,快速适配手机(非跳转)

跨屏前后,网站添加一行代码,快速适配手机,真实效果截图, 采用跨屏平台自主开发的解决方案。 主要的优势 1,pc手机内容及时同步 2,相同的域名访问 3,无需提交百度适配 4,利于seo…

面向用户的网站性能优化

在互联网这个行业,”以用户为中心的设计“已经达成共识,但很少听到有人说”以用户为中心进行性能优化”之类的话,很多时候,网站性能优化是面向服务器来进行,或许,应该扭转一点思维,改到考虑如何…

跨屏建站系统2021.2.17发布更新

跨屏网打造“无印良品”版建站系统,在传统建站系统都习惯性的保留建站平台的信息(版权),以至于形成了一个固有的现象,当一个建站平台上线的时候,往往都会带上平台的一些logo或者版权信息,然而这…

跨屏建站saas系统2021.4.27发布更新

跨屏建站saas系统2021.4.27发布更新,增加了聚合头条板块,saas建站除了成本低,建站快,更多的还是应该能够连接企业与企业的通道,以及帮助企业把信息推广出去,这才是saas建站的本质,也只有saas建站…

如何申请注册跨屏建站“跨屏号”

企业要网络营销,离不开网站。 而做网站的第一步,你只需要注册一个自助建站平台的账号即可快速开启。 跨屏网专注于h5响应式网站的开发,模板多、代码规范标准、后台操作简单,如果后期seo优化做的好,很容易获得百度的排…

电脑版、3g版、触屏版、跨屏版,网站为何需要重新定义?

从pc端为主、pc手机版,再到移动优先,网站到底发生了哪些变化? 跨屏时代的到来,让推广理念和建站方式随之发生改变。 2010年,被许多人称为移动互联网元年,这一年,用户逐渐将重心从PC端转到动端。 跨屏理念渗透到各个行业,比如最各大手机厂商oppo,小米…

我想这就是我选择模板自助建站平台的原因

伴随着低代码、无代码技术的出现,自助建站平台再次受到关注,只要会打字就能建站,面向小白的模板自助建站平台何尝又不是低代码、无代码技术呢?并且随着技术的革新,模板建站提供的模板不仅跨屏自适应,而且也…