网站推荐机制中的艺术、科学与商务问题

news/2024/4/27 9:13:25/文章来源:https://blog.csdn.net/liguiyuan/article/details/2287533

网站推荐机制是电子商务或内容网站的核心功能之一。例如你在一个网站买了一本书后,网站会推荐其他你可能会感兴趣的书。这被认为是亚马逊等电子商务巨头成功的关键。本文对几个出色的推荐系统进行了较透彻的分析。

2006年10月,Netflix搞了一次不寻常的有奖竞赛。这家网上DVD租赁公司开出奖金一百万美元,奖励给能把他们网站的产品推荐机制提高10%的人。Netflix 以富有创新精神和闯劲著称。而一百万美元的奖金对于这样一家公司来说,其实并不象听起来那么多。


有奖竞赛还在进行当中(“至少要进行到2011年10月2日”)。所以这是一场炒作活动还是希望花小钱进行研究,我们还不得而知。而对Netflix来说,更好的推荐机制是必不可少还是锦上添花?今天,Netflix正面对从沉睡中醒来的巨人BlockBuster的挑战,因此它必然要寻找制胜的先机。出色的推荐机制会留住老用户,吸引新用户。比如当一个用户还DVD时,系统会推荐给他/她可能会喜欢的另一部电影。这就增加了这个用户回来再租DVD的可能。

浏览与推荐


一个出色的推荐机制不光对Netflix,对其他网络企业也非常重要。这是因为用户的网上活动分为两类:搜索和浏览。当消费者明确知道她想要什么的时候,她搜索。但当她不太清楚想要什么的时候,她浏览。浏览活动为推荐系统带来了绝好的机会。因为当用户没有集中注意力在找她想要的东西时,她对外来的建议是敞开的。

在浏览过程中,用户的注意力(和他们的钱),都等着你去抓住。通过向用户展示有吸引力的东西,网站可以使交易成功的可能最大化。所以如果网站能增加给用户提供好推荐的几率,就能赚更多钱。显然这不是一个容易解决的问题,但解决这个问题带来的好处是巨大的。推荐的几种方式如下:

  • 个性化的推荐--根据用户过去在网站的行为进行推荐
  • 社会化推荐--根据类似用户过去在网站的行为进行推荐
  • 基于产品的推荐--基于产品本身的特性进行推荐
  • 以上三者的混合


我们现在通过实例详述上述方式。包括老牌网站如亚马逊 Amazon,以及新秀如Pandora(译者:一个收听网上音乐的站点)和del.icio.us(译者:著名的社会化书签网站)。

亚马逊--推荐之王


亚马逊被广泛认为是网上购物行业的领袖,特别是推荐机制的使用。过去十几年间,该公司投入了大量金钱和脑力开发推荐机制,来促使用户更多地购物--包括对你浏览历史、购买历史,以及其他用户购买数据的分析。让我们看看亚马逊推荐机制的几个方面。下面是登陆到我的亚马逊帐户后网页显示的主要部分:



(译者:上图抬头是“消费者浏览了这件商品后买了什么?”下面是三件商品:52%的消费者买了你正在看的这套衬衣;19%买了另一种款式;5%买了灰色的那种)

这部分是社会化推荐。注意,非常量化的分析,给我一个基于数据统计的理由为什么我应该买这套衬衣。而同时这又是个性化的推荐,因为它基于我刚刚点击查看的产品。



(译者:上图抬头是“为你准备的新货”。下面是几本书以及链接“为什么我们推荐这本书给你?”)

这一部分是“基于产品的推荐”,具体说是新书推荐。点击“为什么我们推荐这本书给你?”的链接会显示我的购买历史。因此这同时也是个性化推荐--基于我过去行为的推荐。

这一页上有其他四个部分采用上述推荐机制的结合。我们用下表概括:

亚马逊个性化推荐系统

 
你的浏览历史你的购买历史
实际浏览商品新产品(基于产品的推荐)
相关商品(基于产品的推荐)相关商品(基于产品的推荐)
别人购买的(社会化推荐)别人购买的(社会化推荐)

很自然,这个系统是对称和覆盖全面的。所有推荐都基于用户个人行为,加上商品本身,或者是其他用户在亚马逊的活动。不管是因为你以前购买过相关产品,还是因为其他很多用户都喜欢,亚马逊每推荐给你一件商品,都增大你把它放进你的购物筐的可能。

超越亚马逊

亚马逊的推荐系统是程序自动化和用户相关购物信息天才集合的经典之作。亚马逊花了十几年的时间建立和完善了这个系统。这个系统基于产品和相关用户的巨大数据库;记录的信息包括你在过去几年或几分钟内做过什么。其他新公司如何与之竞争呢?

出乎意料的是,有办法竞争。答案来自与网络购物没什么关系的学科--遗传学。如你所知,遗传学研究DNA片段--基因,如何承载影响人类特性和行为的密码。比如一家人因为他们有某些基因是相同的,因此长相和行为有类似之处。遗传学是一门有150年历史的学科,在医学和历史学的研究中都是一个重要工具。但遗传学一个出乎意料的应用于2000年1月6日出现--Time Westergren和他的朋友们决定把遗传学的概念引入到音乐中。

潘朵拉(Pandora)--基于遗传学的推荐系统

音乐染色体组项目的推出,目的在于把音乐解析成为最基本的基因组成。它的基本想法是:我们因为音乐的某些特性喜欢音乐--那么为什么不能根据音乐的某些相似之处设计出一套推荐系统呢?这类推荐系统应该属于基于产品的推荐。但具有深刻创新意义的是,产品(音乐产品)的相似性,通过“基因”组成来衡量。

(译者:上图是Pandora音乐播放器向用户解释为什么播放一首歌曲:“基于你告诉我们的信息,我们播放这段音乐。因为这段音乐微妙地使用人声合声,混合了声学和电子乐器,有以人声为核心的审美特点,音调以大调为主,以及其他音乐基因组项目中发现的相似性。”)

在奋斗了几年,分析了海量的音乐后,这个项目积累了足够的数据,并推出了名为Pandora的在网上收听音乐的服务。Pandora 由于准确的推荐和用户低成本进入(译者:指用户可以很容易地就试用Pandora的服务)取得巨大成功。用户只需选一名歌手,或一首歌,就可以建立一个用户自己的电台,播放类似的音乐。

这种“即刻满足感”是很难抗拒的。因为Pandora 了解音乐相似性背后的因素,它不需要了解用户的好恶,就可以把用户黏住。确实,Pandora 需要把握用户的口味或记忆--但这正是蕴藏在音乐本身的DNA中了。当然Pandora有时并不完美,会播放不对用户口味的音乐。但这很少发生。

很自然地我们会问:这个基于基因的推荐方式能不能应用于其他产品--如书籍、电影、酒、餐馆、或旅游点呢?对于每一类产品,它的基因又由什么因素组成呢?比如说,对葡萄酒来说,它的基因是否包括对酒的口味的描述呢:黑莓口味、土味、果香型、复合型、混合型,等等。而书籍的基因是否是描述故事情节的用语呢?如果基因真的是让某一个物体在我们头脑中产生独特形象的因素,对于不同的事物我们应该可以把他们的基因定义出来。其实在过去的几年间,我们已经在互联网上做这样的事了。这就是“标签(tagging)”。

Del.icio.us -标签会成为基因么?

Pandora 的初始投入是巨大的。因为成千上万的音乐需要人工来鉴定。社会化书签网站中首屈一指的 del.icio.us 则采用不同的办法--让用户自己来鉴定、标识。这种自组织的方式相当成功,del.icio.us 很快在最初的使用者中流行起来。今天,del.icio.us 已经不仅仅是一个书签网站--它还是一个新闻网站和搜索引擎。但del.icio.us是否也是一个推荐系统呢?



(译者:上图显示加了“Linux”标签的最受欢迎的网页链接,右侧是相关标签。)

答案是肯定的。这是一个非常简明的推荐系统,它指基于一个基因--那就是一个标签。例如在上图中,我们看到最受欢迎的加了“Linux”标签的网页链接,同时还看到相关链接如“Open source (开源软件)”和“ubuntu (Linux 操作系统的一个版本)”。而一个更令人兴奋的推荐系统是基于多个标签的吻合。然而由于算法还不完善,这一点的作用并不明显。但至少,这一功能对于Read/WriteWeb 的网页(译者:原文的站点)是有效的,在下图中,可以看到右侧显示的与 Read/WriteWeb 类似的其他博客。


因此,del.icio.us 的机制有可能发展成为一个有趣的自助分类、组织的推荐系统。如果有足够的用户并逐步调整系统,用群体的力量加标签的方式可以建立起一个对书、葡萄酒、音乐同样有效的推荐系统。前题是,标签要准确到能够成为被标签对象的基因!

结论

推荐引擎是网上电子商务系统和用户体验的一个重要组成部分。网上零售商们有强烈的意愿向那些正在浏览的用户提供推荐,以驱使他们购买。亚马逊有一套非常出色的个性化推荐系统,是这个领域的领先者。其他网上零售商面临的问题是缺乏用户信息和软件构架不完善。

最新的推荐引擎,如受遗传学启发的Pandora和基于群体社会化标签的del.icio.us都是非常有趣的新发展。这些系统的长处在于“即刻满意度”--不需要用户提供他们的偏好和过去的浏览或消费历史。不管未来如何发展,亚马逊、Pandora和del.icio.us目前展示了极其出色的推荐技术。我们向您推荐这几个系统,并对未来拭目以待。

 




本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_871303.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

著名杀毒网站 江民再次被黑

以下新闻为转载,文中涉及观点不代表本人立场 前言 . . . 前一阵闹的沸沸扬扬的江民被黑事件,到现在可以说是告一段落。 因为江民被黑事件而一跃成名的河马史诗也消失在了网络中了。 保守的估计来说 可能是学习真正的计算机网络安全知识去了吧。 在各大网站转载的文…

Google Friendly的网站设计

转载自chedong的blog,一篇很好的文章,居然刚刚从简朴生活的blog上看到 版权声明:可以任意转载,转载时请务必以超链接形式标明文章原始出处和作者信息及本声明http://www.chedong.com/tech/google.html 关键词:Google P…

为我的网站预热一下

话说在前面文章提到过准备搞一个网站,经过调研在国内 Google Play 还没有比较成熟的社区给大家讨论,大多数是比较大的社区其中有一个 Google Play 的板块,问题和相关信息更新速度也比较慢,遇到问题很难快速的找到想要的答案&#…

网络安全大赛模拟网站,黑客模拟网站,分享几个玩玩~

最近看了《亲爱的,热爱的》电视剧,一开始是这些网络大赛镜头吸引了我,后面渐渐的陷入了韩商言和年年的甜蜜中。。。据说原著是电竞游戏,电视剧改编成网络安全大赛了,可能是想更多的网友认识下网络安全大赛,…

想要成为python大神,这17个老司机收藏的国外免费学习网站不可错过!

用Python编写代码一点都不难,事实上它一直被赞誉为最容易学的编程语言。 如果你准备学习web开发, Python是一个不错的开始,甚至想做游戏的话,用Python来开发游戏的资源也有很多。 许多程序员都把Python作为编程之旅的开始&#…

一步步构建大型网站架构

之前我简单向大家介绍了各个知名大型网站的架构,亿万用户网站MySpace的成功秘密、Flickr架构、YouTube网站架构、PlentyOfFish 网站架构学习、WikiPedia技术架构学习笔记。这几个都很典型,我们可以从中获取很多有关网站架构方面的知识,看了之…

网站启动SSL, http变为https后,session验证码错误解决方法

网站启动SSL, http变为https后,session验证码错误解决方法 最近公司需要后台启动安全证书,证书安装完毕后,后台老提示 验证码错误,经过几天的研究,此问题已经得到有效解决,现把方法如下。 一、问…

解决织梦手机网站M文件夹动态游览不生成html

今天的做手机网站的时候,发现dede织梦M文件夹下会生成index.html。对于手机网站来说,太麻烦了。每次更新手机网站首页都要把index.html删除掉重新生成。 然而织梦不支持手机网站首页动态游览。只有自己动手,丰衣足食。 百度了很久没有找到方法…

LAMP架构部署和动态网站环境的配置

LAMP架构部署和动态网站环境的配置 实验环境: 操作系统:centos 7.5 服务器IP:192.168.10.5 运行用户:root 连接工具:xshell工具 web环境:Linuxapachephpmariadb(LAMP架构) 大型…

找工作有哪些网站

智联、51,三顾人才、拉勾,boss直聘都是可以的。不过不要盲目遵从大众的品味。如果你是一名资深java,那么你上智联、51,拉勾投递简历,效果都会不好,或许会很长一段时间才收到面试的电话,并且应聘的公司甚至还…

使用VS2008开发运行在.net 2.0环境下的 ASP.NET AJAX 网站

前段时间想做个博客系统,用着vs2008很顺手,所有准备在上面开发。在选择JS框架的时候看重了 asp.net ajax,但是后来查阅资料,发现vs2008下面开发的asp.net ajax程序在.net framework2.0下面没法部署运行,原因都是可爱的…

正确设计网站的搜索框

1、搜索框的意义 对于一个网站,站内搜索不仅仅是有帮助性的,甚至是至关重要的设计功能,有可能比网站的导航更对用户有帮助。最好的搜索设计就是给用户提供一个简简单单的搜索框在页面显眼固定的位置上,但却有着强力搜索的能…

实例讲解:全程追踪入侵JSP网站服务器

在用JSP制作的电子商务网站多如牛毛。但是对于JSP网站而言, 安全性真的能够让人放心吗?面对层出不穷的黑客攻击和病毒袭击,JSP网站的 服务器能够比其他网站的服务器器更加安全吗?前段时间,应朋友之邀,我对…

合法练习黑客技术?这15个网站也许可以帮到你

俗话说得好,最好的防守就是进攻,而这句话同样适用于信息安全领域。接下来,我们将给大家介绍15个最新的网络安全网站。无论你是开发人员、安全专家、审计人员、或者是渗透测试人员,你都可以利用这些网站来提升你的黑客技术。熟能生…

我学python3 爬虫之登录网站

一直对编程感兴趣,但始终敬而远之,仅了解过一些皮毛。去年年底戒掉游戏,就突发奇想,认真学一门语言。问了一下度娘,说非科班出生比较适合学Python。因为之前对Python一点不了解,在网上搜了一些资料看&#…

WordPress网站加载WAITING (TTFB) 时间过长解决办法

WordPress 刚刚安装的时候,性能是没问题的,我们安装了主题、插件、添加了一些小工具和菜单,然后我们就开始上传内容了,我们都很勤快 Waiting (TTFB) 时间 Time to First Byte 指的是浏览器开始收到服务器响应数据的时间&#xf…

网站运行缓慢的 12 个原因(以及如何修复它们)

如今用户希望网站速度快。当页面加载时间超过预期时,会对您网站的用户体验 (UX)产生负面影响。这很重要,因为每当您的用户体验受到影响时,您的转化率也会受到影响。您可能还会看到更高的页面放弃率和跳出率。额外的两秒加载时间可以将您网站的…

WordPress网站搬家换域名(数据迁移无丢失)

新站点 新域名 新数据库 利用插件2个步骤即可完成迁移替换等操作,算是和演示站克隆一样的效果,包括主题设置模板那些。百度上的WordPress迁移搬家教程方法都是千篇一律只管复制粘贴,不管情况是否一致正确可行,毫无人性可言。请各位…

谷歌广告联盟(Google Adsense)通过网站获利功能在线创收

Google作为全球最大搜索引擎,拥有全球近27亿用户的使用可以讲是最大的搜索引擎了。。可以说是国内某度没有办法比的。谷歌广告联盟(Google AdSense)门槛较高,一个用户只能申请一个谷歌账号,当你有了一个英文站之后最难的就是这个站的流量。 谷…