网站推荐机制中的艺术、科学与商务问题

news/2024/4/27 2:10:13/文章来源:https://blog.csdn.net/softstars/article/details/2274583

网站推荐机制是电子商务或内容网站的核心功能之一。例如你在一个网站买了一本书后,网站会推荐其他你可能会感兴趣的书。这被认为是亚马逊等电子商务巨头成功的关键。本文对几个出色的推荐系统进行了较透彻的分析。

2006年10月,Netflix搞了一次不寻常的有奖竞赛。这家网上DVD租赁公司开出奖金一百万美元,奖励给能把他们网站的产品推荐机制提高10%的人。Netflix 以富有创新精神和闯劲著称。而一百万美元的奖金对于这样一家公司来说,其实并不象听起来那么多。


有奖竞赛还在进行当中(“至少要进行到2011年10月2日”)。所以这是一场炒作活动还是希望花小钱进行研究,我们还不得而知。而对Netflix来说,更好的推荐机制是必不可少还是锦上添花?今天,Netflix正面对从沉睡中醒来的巨人BlockBuster的挑战,因此它必然要寻找制胜的先机。出色的推荐机制会留住老用户,吸引新用户。比如当一个用户还DVD时,系统会推荐给他/她可能会喜欢的另一部电影。这就增加了这个用户回来再租DVD的可能。

浏览与推荐


一个出色的推荐机制不光对Netflix,对其他网络企业也非常重要。这是因为用户的网上活动分为两类:搜索和浏览。当消费者明确知道她想要什么的时候,她搜索。但当她不太清楚想要什么的时候,她浏览。浏览活动为推荐系统带来了绝好的机会。因为当用户没有集中注意力在找她想要的东西时,她对外来的建议是敞开的。

在浏览过程中,用户的注意力(和他们的钱),都等着你去抓住。通过向用户展示有吸引力的东西,网站可以使交易成功的可能最大化。所以如果网站能增加给用户提供好推荐的几率,就能赚更多钱。显然这不是一个容易解决的问题,但解决这个问题带来的好处是巨大的。推荐的几种方式如下:

  • 个性化的推荐--根据用户过去在网站的行为进行推荐
  • 社会化推荐--根据类似用户过去在网站的行为进行推荐
  • 基于产品的推荐--基于产品本身的特性进行推荐
  • 以上三者的混合


我们现在通过实例详述上述方式。包括老牌网站如亚马逊 Amazon,以及新秀如Pandora(译者:一个收听网上音乐的站点)和del.icio.us(译者:著名的社会化书签网站)。

亚马逊--推荐之王


亚马逊被广泛认为是网上购物行业的领袖,特别是推荐机制的使用。过去十几年间,该公司投入了大量金钱和脑力开发推荐机制,来促使用户更多地购物--包括对你浏览历史、购买历史,以及其他用户购买数据的分析。让我们看看亚马逊推荐机制的几个方面。下面是登陆到我的亚马逊帐户后网页显示的主要部分:



(译者:上图抬头是“消费者浏览了这件商品后买了什么?”下面是三件商品:52%的消费者买了你正在看的这套衬衣;19%买了另一种款式;5%买了灰色的那种)

这部分是社会化推荐。注意,非常量化的分析,给我一个基于数据统计的理由为什么我应该买这套衬衣。而同时这又是个性化的推荐,因为它基于我刚刚点击查看的产品。



(译者:上图抬头是“为你准备的新货”。下面是几本书以及链接“为什么我们推荐这本书给你?”)

这一部分是“基于产品的推荐”,具体说是新书推荐。点击“为什么我们推荐这本书给你?”的链接会显示我的购买历史。因此这同时也是个性化推荐--基于我过去行为的推荐。

这一页上有其他四个部分采用上述推荐机制的结合。我们用下表概括:

亚马逊个性化推荐系统

 
你的浏览历史你的购买历史
实际浏览商品新产品(基于产品的推荐)
相关商品(基于产品的推荐)相关商品(基于产品的推荐)
别人购买的(社会化推荐)别人购买的(社会化推荐)

很自然,这个系统是对称和覆盖全面的。所有推荐都基于用户个人行为,加上商品本身,或者是其他用户在亚马逊的活动。不管是因为你以前购买过相关产品,还是因为其他很多用户都喜欢,亚马逊每推荐给你一件商品,都增大你把它放进你的购物筐的可能。

超越亚马逊

亚马逊的推荐系统是程序自动化和用户相关购物信息天才集合的经典之作。亚马逊花了十几年的时间建立和完善了这个系统。这个系统基于产品和相关用户的巨大数据库;记录的信息包括你在过去几年或几分钟内做过什么。其他新公司如何与之竞争呢?

出乎意料的是,有办法竞争。答案来自与网络购物没什么关系的学科--遗传学。如你所知,遗传学研究DNA片段--基因,如何承载影响人类特性和行为的密码。比如一家人因为他们有某些基因是相同的,因此长相和行为有类似之处。遗传学是一门有150年历史的学科,在医学和历史学的研究中都是一个重要工具。但遗传学一个出乎意料的应用于2000年1月6日出现--Time Westergren和他的朋友们决定把遗传学的概念引入到音乐中。

潘朵拉(Pandora)--基于遗传学的推荐系统

音乐染色体组项目的推出,目的在于把音乐解析成为最基本的基因组成。它的基本想法是:我们因为音乐的某些特性喜欢音乐--那么为什么不能根据音乐的某些相似之处设计出一套推荐系统呢?这类推荐系统应该属于基于产品的推荐。但具有深刻创新意义的是,产品(音乐产品)的相似性,通过“基因”组成来衡量。

(译者:上图是Pandora音乐播放器向用户解释为什么播放一首歌曲:“基于你告诉我们的信息,我们播放这段音乐。因为这段音乐微妙地使用人声合声,混合了声学和电子乐器,有以人声为核心的审美特点,音调以大调为主,以及其他音乐基因组项目中发现的相似性。”)

在奋斗了几年,分析了海量的音乐后,这个项目积累了足够的数据,并推出了名为Pandora的在网上收听音乐的服务。Pandora 由于准确的推荐和用户低成本进入(译者:指用户可以很容易地就试用Pandora的服务)取得巨大成功。用户只需选一名歌手,或一首歌,就可以建立一个用户自己的电台,播放类似的音乐。

这种“即刻满足感”是很难抗拒的。因为Pandora 了解音乐相似性背后的因素,它不需要了解用户的好恶,就可以把用户黏住。确实,Pandora 需要把握用户的口味或记忆--但这正是蕴藏在音乐本身的DNA中了。当然Pandora有时并不完美,会播放不对用户口味的音乐。但这很少发生。

很自然地我们会问:这个基于基因的推荐方式能不能应用于其他产品--如书籍、电影、酒、餐馆、或旅游点呢?对于每一类产品,它的基因又由什么因素组成呢?比如说,对葡萄酒来说,它的基因是否包括对酒的口味的描述呢:黑莓口味、土味、果香型、复合型、混合型,等等。而书籍的基因是否是描述故事情节的用语呢?如果基因真的是让某一个物体在我们头脑中产生独特形象的因素,对于不同的事物我们应该可以把他们的基因定义出来。其实在过去的几年间,我们已经在互联网上做这样的事了。这就是“标签(tagging)”。

Del.icio.us -标签会成为基因么?

Pandora 的初始投入是巨大的。因为成千上万的音乐需要人工来鉴定。社会化书签网站中首屈一指的 del.icio.us 则采用不同的办法--让用户自己来鉴定、标识。这种自组织的方式相当成功,del.icio.us 很快在最初的使用者中流行起来。今天,del.icio.us 已经不仅仅是一个书签网站--它还是一个新闻网站和搜索引擎。但del.icio.us是否也是一个推荐系统呢?



(译者:上图显示加了“Linux”标签的最受欢迎的网页链接,右侧是相关标签。)

答案是肯定的。这是一个非常简明的推荐系统,它指基于一个基因--那就是一个标签。例如在上图中,我们看到最受欢迎的加了“Linux”标签的网页链接,同时还看到相关链接如“Open source (开源软件)”和“ubuntu (Linux 操作系统的一个版本)”。而一个更令人兴奋的推荐系统是基于多个标签的吻合。然而由于算法还不完善,这一点的作用并不明显。但至少,这一功能对于Read/WriteWeb 的网页(译者:原文的站点)是有效的,在下图中,可以看到右侧显示的与 Read/WriteWeb 类似的其他博客。


因此,del.icio.us 的机制有可能发展成为一个有趣的自助分类、组织的推荐系统。如果有足够的用户并逐步调整系统,用群体的力量加标签的方式可以建立起一个对书、葡萄酒、音乐同样有效的推荐系统。前题是,标签要准确到能够成为被标签对象的基因!

结论

推荐引擎是网上电子商务系统和用户体验的一个重要组成部分。网上零售商们有强烈的意愿向那些正在浏览的用户提供推荐,以驱使他们购买。亚马逊有一套非常出色的个性化推荐系统,是这个领域的领先者。其他网上零售商面临的问题是缺乏用户信息和软件构架不完善。

最新的推荐引擎,如受遗传学启发的Pandora和基于群体社会化标签的del.icio.us都是非常有趣的新发展。这些系统的长处在于“即刻满意度”--不需要用户提供他们的偏好和过去的浏览或消费历史。不管未来如何发展,亚马逊、Pandora和del.icio.us目前展示了极其出色的推荐技术。我们向您推荐这几个系统,并对未来拭目以待。

 




本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_871414.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

实际采用 FleaPHP 的网站

下面都是采用 FleaPHP 框架开发的网站列表,如果发现无效连接请在留言。 如果你有采用 FleaPHP 开发的网站,并且愿意公开网址,可以发邮件到 dualface (at) gmail.com 需要提供的信息包括网站名称和连接地址,以及简单的介绍文字。 云…

Google 联合一些社交网站来对抗 facebook

谷歌 (Google) 将与其它一些行业领先的社交网站联手,共同对抗互联网新贵Facebook。  谷歌将于周四推出一个通用标准集 ( OpenSocial ),允许软件开发者为谷歌旗下社交网站Orkut,以及LinkedIn、hi5、Friendster、Plaxo和Ning等其它社交网站…

从“奥运门票网站800万访问量”想到的成本、质量、进度、风险等关系

看到这个新闻后颇有一番滋味,更体验到我一直关注的软件性能着实无处不在,这个案例也确实值得我们好好反思一下。 不知道网友们有没有报名参加国际日语考试的——这个网站每年05年前都有人不能报名,因为报名人数太多,所以报名当日大…

电信网通证实台湾地震影响内地访问国际网站(12月27日)

电信网通证实台湾地震影响内地访问国际网站 http://www.sina.com.cn 2006年12月27日 09:39 东方网 中国国际海底光缆网络 中美六家运营商正在共同建设连接中国和美国的兆兆级海底光缆系统——跨太平洋直达光缆系统 东方网讯 12月27日消息,从今日凌晨起&#xff0c…

Red Hat推出”MugShot”社交娱乐网站

网址: http://mugshot.org/ Red Hat近来推出”MugShot”网站, MugShot是一个致力于在线社交娱乐的开源项目. 它提供了更方便的网页和音乐分享. 当前MugShot处于测试阶段, 只提供邀请帐号. 你可以从这里申请. 更多信息见常见问题和开发主页. 欢迎任何问题和建议.

No ‘Access-Control-Allow-Origin‘ header is present on the requested resource解决+网站部署友盟统计

今天上社团整的论坛app的网页版的时候,因为老学长给我发的是域名,没有加http和https的,我直接复制到URL地址的时候,发现页面也是正常显示,但是发现登陆的时候出了报错。 看了下报错并且百度一下貌似是跨域&#xff0c…

付费DDoS服务——18岁以色列黑客运营“vDos”网站被捕

看到最后忍不住笑了 被自己的东西坑到简直防不胜防 少年运营“vDos”服务不正当牟利 报道称,两名18岁的少年要对15万起 DDoS攻击负责,他们基于此两年内牟利价值约60万美元的比特币。他们的服务可称为vDos,向目标网站发起DDoS攻击。vDos每起攻…

为何大量网站不能抓取?爬虫突破封禁的6种常见方法 - 转载

传送门:http://www.cnblogs.com/junrong624/p/5533655.html 在互联网上进行自动数据采集(抓取)这件事和互联网存在的时间差不多一样长。今天大众好像更倾向于用“网络数据采集”,有时会把网络数据采集程序称为网络机器人&#xff…

【20210727】图说全球网站数量及服务器市场份额

2021年07月27日 作者:小蒋聊技术 大家好,欢迎来到小蒋聊技术。小蒋准备和大家一起聊聊技术的那些事。 小蒋记得雷军曾经说过一句话,那就是“站在风口上,猪都能飞起来”。这句话后来成为了很多创业者引用的名言。这也就解释了为什…

一文学会使用selenium, 并实现登录挂英语网站不掉线

本文用于快速入门或者复习selenium的webdriver但不讲解如何安装selenium以及ChromeDriver 先教一些简单功能,各函数功能在注释里 from selenium import webdriver import time#访问百度首页 first_url http://www.baidu.com print("正在访问%s" % (fir…

Google 联合一些社交网站来对抗 facebook

谷歌 (Google) 将与其它一些行业领先的社交网站联手,共同对抗互联网新贵Facebook。  谷歌将于周四推出一个通用标准集 ( OpenSocial ),允许软件开发者为谷歌旗下社交网站Orkut,以及LinkedIn、hi5、Friendster、Plaxo和Ning等其它社交网站…

搜索引擎SEO外挂:一边搜索,一边看PageRank

搜索引擎SEO外挂:一边搜索,一边看PageRank 下载地址:多么乐站长工具 我原来曾写过一篇统计分析搜索引擎排名和Page Rank 关联分析 的文章。很多人引用,回复和我讨论了我的结论。有赞成的,有反对的,有鼓励的…

seo优化:把百度放进数据库

seo优化:把百度放进数据库 有时候我想,能把百度的数据放进数据库,用广大程序员熟悉的sql语句查询百度的搜索结果应该是一个不错的主意。在这方面Google早已经跨出了一大步,利用Google Search API 把Google的搜索结果放进数据库是很容易办到得…

Web2.0网站的路径依赖--探讨蚂蚁社区为什么要导入博客

郑昀 2007-5-13 以下文章即将讨论的问题涉及这几个关键词: l 网站启动的核心用户从哪里来? l 网站启动时需要什么样的种子用户? l 最初吸引来的种子用户对网站有什么路径依赖作用? 麦田曾经问道:…

实际采用 FleaPHP 的网站

下面都是采用 FleaPHP 框架开发的网站列表,如果发现无效连接请在留言。 如果你有采用 FleaPHP 开发的网站,并且愿意公开网址,可以发邮件到 dualface (at) gmail.com 需要提供的信息包括网站名称和连接地址,以及简单的介绍文字。 云…

[转]开发大型高负载类网站应用的几个要点

开发大型高负载类网站应用的几个要点 作者: nightsailer 来源: http://www.phpchina.com/bbs/thread-15484-1-1.html 看了一些人的所谓大型项目的方法,我感觉都是没有说到点子上,有点难受。 我也说说自己的看法.我个人认为,很难衡量所谓项目是…

[转]从LiveJournal后台发展看大规模网站性能优化方法

从LiveJournal后台发展看大规模网站性能优化方法 作者:于敦德 2006-3-16来源:http://www.example.net.cn/archives/2006/03/olivejournaloio.html 一、LiveJournal发展历程 LiveJournal是99年始于校园中的项目,几个人出于爱好做了这样一个应用…

邀请PHP开发工程师加盟Web3.0新锐网站[工作地点-北京财智国际大厦]

我们的大方向是: 如何更快、更准地帮助用户找到他所需要的信息。这也就是以前搜索引擎诞生的原因。但搜索引擎仅仅是一种解决办法,而且还远不完美。这将是我们致力的方向。我们的两个理念是: 按主题重组织全网内容; 按人…

郑昀邀请网站开发工程师架构师加盟Web3.0新锐网站[工作地点-北京财智国际大厦]

公司新年新气象,刚刚换到了一个大办公室,也离中关村更近了。随着公司规模的扩大,开始了新一轮的招兵买马,哈哈。请各位帮忙看看有没有合适的人选推荐,不胜感谢! 招聘:研发部 招聘岗位1:PHP网站架…