网站推荐机制中的艺术、科学与商务问题

news/2024/4/29 5:11:57/文章来源:https://blog.csdn.net/hejishan/article/details/2240106

网站推荐机制是电子商务或内容网站的核心功能之一。例如你在一个网站买了一本书后,网站会推荐其他你可能会感兴趣的书。这被认为是亚马逊等电子商务巨头成功的关键。本文对几个出色的推荐系统进行了较透彻的分析。

2006年10月,Netflix搞了一次不寻常的有奖竞赛。这家网上DVD租赁公司开出奖金一百万美元,奖励给能把他们网站的产品推荐机制提高10%的人。Netflix 以富有创新精神和闯劲著称。而一百万美元的奖金对于这样一家公司来说,其实并不象听起来那么多。


有奖竞赛还在进行当中(“至少要进行到2011年10月2日”)。所以这是一场炒作活动还是希望花小钱进行研究,我们还不得而知。而对Netflix来说,更好的推荐机制是必不可少还是锦上添花?今天,Netflix正面对从沉睡中醒来的巨人BlockBuster的挑战,因此它必然要寻找制胜的先机。出色的推荐机制会留住老用户,吸引新用户。比如当一个用户还DVD时,系统会推荐给他/她可能会喜欢的另一部电影。这就增加了这个用户回来再租DVD的可能。

浏览与推荐


一个出色的推荐机制不光对Netflix,对其他网络企业也非常重要。这是因为用户的网上活动分为两类:搜索和浏览。当消费者明确知道她想要什么的时候,她搜索。但当她不太清楚想要什么的时候,她浏览。浏览活动为推荐系统带来了绝好的机会。因为当用户没有集中注意力在找她想要的东西时,她对外来的建议是敞开的。

在浏览过程中,用户的注意力(和他们的钱),都等着你去抓住。通过向用户展示有吸引力的东西,网站可以使交易成功的可能最大化。所以如果网站能增加给用户提供好推荐的几率,就能赚更多钱。显然这不是一个容易解决的问题,但解决这个问题带来的好处是巨大的。推荐的几种方式如下:

  • 个性化的推荐--根据用户过去在网站的行为进行推荐
  • 社会化推荐--根据类似用户过去在网站的行为进行推荐
  • 基于产品的推荐--基于产品本身的特性进行推荐
  • 以上三者的混合


我们现在通过实例详述上述方式。包括老牌网站如亚马逊 Amazon,以及新秀如Pandora(译者:一个收听网上音乐的站点)和del.icio.us(译者:著名的社会化书签网站)。

亚马逊--推荐之王


亚马逊被广泛认为是网上购物行业的领袖,特别是推荐机制的使用。过去十几年间,该公司投入了大量金钱和脑力开发推荐机制,来促使用户更多地购物--包括对你浏览历史、购买历史,以及其他用户购买数据的分析。让我们看看亚马逊推荐机制的几个方面。下面是登陆到我的亚马逊帐户后网页显示的主要部分:



(译者:上图抬头是“消费者浏览了这件商品后买了什么?”下面是三件商品:52%的消费者买了你正在看的这套衬衣;19%买了另一种款式;5%买了灰色的那种)

这部分是社会化推荐。注意,非常量化的分析,给我一个基于数据统计的理由为什么我应该买这套衬衣。而同时这又是个性化的推荐,因为它基于我刚刚点击查看的产品。



(译者:上图抬头是“为你准备的新货”。下面是几本书以及链接“为什么我们推荐这本书给你?”)

这一部分是“基于产品的推荐”,具体说是新书推荐。点击“为什么我们推荐这本书给你?”的链接会显示我的购买历史。因此这同时也是个性化推荐--基于我过去行为的推荐。

这一页上有其他四个部分采用上述推荐机制的结合。我们用下表概括:

亚马逊个性化推荐系统

 
你的浏览历史你的购买历史
实际浏览商品新产品(基于产品的推荐)
相关商品(基于产品的推荐)相关商品(基于产品的推荐)
别人购买的(社会化推荐)别人购买的(社会化推荐)

很自然,这个系统是对称和覆盖全面的。所有推荐都基于用户个人行为,加上商品本身,或者是其他用户在亚马逊的活动。不管是因为你以前购买过相关产品,还是因为其他很多用户都喜欢,亚马逊每推荐给你一件商品,都增大你把它放进你的购物筐的可能。

超越亚马逊

亚马逊的推荐系统是程序自动化和用户相关购物信息天才集合的经典之作。亚马逊花了十几年的时间建立和完善了这个系统。这个系统基于产品和相关用户的巨大数据库;记录的信息包括你在过去几年或几分钟内做过什么。其他新公司如何与之竞争呢?

出乎意料的是,有办法竞争。答案来自与网络购物没什么关系的学科--遗传学。如你所知,遗传学研究DNA片段--基因,如何承载影响人类特性和行为的密码。比如一家人因为他们有某些基因是相同的,因此长相和行为有类似之处。遗传学是一门有150年历史的学科,在医学和历史学的研究中都是一个重要工具。但遗传学一个出乎意料的应用于2000年1月6日出现--Time Westergren和他的朋友们决定把遗传学的概念引入到音乐中。

潘朵拉(Pandora)--基于遗传学的推荐系统

音乐染色体组项目的推出,目的在于把音乐解析成为最基本的基因组成。它的基本想法是:我们因为音乐的某些特性喜欢音乐--那么为什么不能根据音乐的某些相似之处设计出一套推荐系统呢?这类推荐系统应该属于基于产品的推荐。但具有深刻创新意义的是,产品(音乐产品)的相似性,通过“基因”组成来衡量。

(译者:上图是Pandora音乐播放器向用户解释为什么播放一首歌曲:“基于你告诉我们的信息,我们播放这段音乐。因为这段音乐微妙地使用人声合声,混合了声学和电子乐器,有以人声为核心的审美特点,音调以大调为主,以及其他音乐基因组项目中发现的相似性。”)

在奋斗了几年,分析了海量的音乐后,这个项目积累了足够的数据,并推出了名为Pandora的在网上收听音乐的服务。Pandora 由于准确的推荐和用户低成本进入(译者:指用户可以很容易地就试用Pandora的服务)取得巨大成功。用户只需选一名歌手,或一首歌,就可以建立一个用户自己的电台,播放类似的音乐。

这种“即刻满足感”是很难抗拒的。因为Pandora 了解音乐相似性背后的因素,它不需要了解用户的好恶,就可以把用户黏住。确实,Pandora 需要把握用户的口味或记忆--但这正是蕴藏在音乐本身的DNA中了。当然Pandora有时并不完美,会播放不对用户口味的音乐。但这很少发生。

很自然地我们会问:这个基于基因的推荐方式能不能应用于其他产品--如书籍、电影、酒、餐馆、或旅游点呢?对于每一类产品,它的基因又由什么因素组成呢?比如说,对葡萄酒来说,它的基因是否包括对酒的口味的描述呢:黑莓口味、土味、果香型、复合型、混合型,等等。而书籍的基因是否是描述故事情节的用语呢?如果基因真的是让某一个物体在我们头脑中产生独特形象的因素,对于不同的事物我们应该可以把他们的基因定义出来。其实在过去的几年间,我们已经在互联网上做这样的事了。这就是“标签(tagging)”。

Del.icio.us -标签会成为基因么?

Pandora 的初始投入是巨大的。因为成千上万的音乐需要人工来鉴定。社会化书签网站中首屈一指的 del.icio.us 则采用不同的办法--让用户自己来鉴定、标识。这种自组织的方式相当成功,del.icio.us 很快在最初的使用者中流行起来。今天,del.icio.us 已经不仅仅是一个书签网站--它还是一个新闻网站和搜索引擎。但del.icio.us是否也是一个推荐系统呢?



(译者:上图显示加了“Linux”标签的最受欢迎的网页链接,右侧是相关标签。)

答案是肯定的。这是一个非常简明的推荐系统,它指基于一个基因--那就是一个标签。例如在上图中,我们看到最受欢迎的加了“Linux”标签的网页链接,同时还看到相关链接如“Open source (开源软件)”和“ubuntu (Linux 操作系统的一个版本)”。而一个更令人兴奋的推荐系统是基于多个标签的吻合。然而由于算法还不完善,这一点的作用并不明显。但至少,这一功能对于Read/WriteWeb 的网页(译者:原文的站点)是有效的,在下图中,可以看到右侧显示的与 Read/WriteWeb 类似的其他博客。


因此,del.icio.us 的机制有可能发展成为一个有趣的自助分类、组织的推荐系统。如果有足够的用户并逐步调整系统,用群体的力量加标签的方式可以建立起一个对书、葡萄酒、音乐同样有效的推荐系统。前题是,标签要准确到能够成为被标签对象的基因!

结论

推荐引擎是网上电子商务系统和用户体验的一个重要组成部分。网上零售商们有强烈的意愿向那些正在浏览的用户提供推荐,以驱使他们购买。亚马逊有一套非常出色的个性化推荐系统,是这个领域的领先者。其他网上零售商面临的问题是缺乏用户信息和软件构架不完善。

最新的推荐引擎,如受遗传学启发的Pandora和基于群体社会化标签的del.icio.us都是非常有趣的新发展。这些系统的长处在于“即刻满意度”--不需要用户提供他们的偏好和过去的浏览或消费历史。不管未来如何发展,亚马逊、Pandora和del.icio.us目前展示了极其出色的推荐技术。我们向您推荐这几个系统,并对未来拭目以待。

 




本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_818924.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OpenCms创建网站过程图解——献给OpenCms的初学者们

很多人都听说了OpenCms,知道了它的强大,索性的下载安装了,终于见到了久违OpenCms,看到了它简洁的界面,欣喜过后却不免一脸茫然,这个东西怎么用,我怎么用它来建站,从哪开始&#xff0…

实际采用 FleaPHP 的网站

下面都是采用 FleaPHP 框架开发的网站列表,如果发现无效连接请在留言。如果你有采用 FleaPHP 开发的网站,并且愿意公开网址,可以发邮件到 dualface (at) gmail.com需要提供的信息包括网站名称和连接地址,以及简单的介绍文字。云南…

[转]开发大型高负载类网站应用的几个要点

开发大型高负载类网站应用的几个要点作者:nightsailer 来源:http://www.phpchina.com/bbs/thread-15484-1-1.html看了一些人的所谓大型项目的方法,我感觉都是没有说到点子上,有点难受。我也说说自己的看法.我个人认为,很难衡量所谓项目是否大…

Linux 私房菜————LAMP架构企业网站 | Apache源码安装 | MySQL源码安装 | PHP源码安装

LAMP架构企业网站1.LAMP概述2.LAMP组件的作用介绍2.1 Linux[基础平台]2.2 Apache[ 前台]2.3 MySQL[后台]2.4 PHP/Python/Perl[中间连接]3.源码编译安装Apache服务3.1 安装环境依赖包3.2 配置模块3.3 开始编译安装3.4 创建链接文件方便日后配置维护[可选]3.5 添加httpd系统服务方…

Linux 私房菜————Nginx网站服务|访问状态统计配置|访问控制|

1.Nginx概述 一款高性能、轻量级Web服务软件 稳定性高 系统资源消耗低 对HTTP并发连接的处理能力高 单台物理服务器可支持30000~50000个并发请求 2.编译安装Nginx服务 2.1 关闭防火墙将nginx所需软件包到/opt目录下 systemctl stop firewalld systemctl disable firewalld …

推荐几个好玩又有难度的编程网站

分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow也欢迎大家转载本篇文章。分享知识,造福人民,实现我们中华民族伟大复兴!推荐几个好玩又有难度的编程网站作者&#x…

Red Hat推出”MugShot”社交娱乐网站

网址: http://mugshot.org/Red Hat近来推出”MugShot”网站, MugShot是一个致力于在线社交娱乐的开源项目. 它提供了更方便的网页和音乐分享. 当前MugShot处于测试阶段, 只提供邀请帐号. 你可以从这里申请. 更多信息见常见问题和开发主页.欢迎任何问题和建议.

Google 联合一些社交网站来对抗 facebook

谷歌(Google) 将与其它一些行业领先的社交网站联手,共同对抗互联网新贵Facebook。  谷歌将于周四推出一个通用标准集 ( OpenSocial ),允许软件开发者为谷歌旗下社交网站Orkut,以及LinkedIn、hi5、Friendster、Plaxo和Ning等其它社交网站开…

我在建站过程中的一点心得体会

原创文章请认准:主网站  微笑涛声     作者其他平台: CSDN    简书    开源中国    思否 所有的努力,不是为了让别人觉得你了不起,而是为了能让自己打心里看得起自己,人生的奔跑,不在于瞬…

SEO优化:Sitemap插件生成WordPress网站地图

▣ 前言 什么是sitemap网站地图?wordpress如何自动生成sitemap地图文件呢? 对于网站建设来说,网站地图是非常关键的,因为这对搜索引擎收录是很有利的。网上有很多方法介绍sitemap网站地图的制作。大体分为两种,一种是自…

建站分享:调整WordPress自带标签云参数

▣ 博主主站地址:微笑涛声 【www.cztcms.cn】 ▣ 博主其他平台: CSDN 简书 开源中国 思否 华为云博客 WordPress 自带的标签云是一个很实用的小工具。站长可以通过标签对具有相同关健词的文章进行检索分类,利于访客查找相关文章。 WordPress标签默认显…

建站分享:WordPress自定义网站背景图片

▣ 博主主站地址:微笑涛声 【www.cztcms.cn】 ▣ 博主其他平台: CSDN 简书 开源中国 思否 华为云博客 我的博客从上线到现在,网站背景一直是纯色的。突然想把背景改为图片。好在WordPress自定义背景图片比价简单。 1、找到正在使用的主题的…

建站分享:Gitee+PicGo 搭建Markdown图床

图床是干什么的? 图床就是一个便于在博文中插入在线图片连接的个人图片仓库。设置图床之后,在自己博客中插入的图片链接就可以随时随地在线预览了,并且不会因为任何意外原因无法查看,除非自己亲自删除。 ▣ 博主主站地址&#xff…

分享我的第一个Web作品——纯静态网站

以下是一年前学习Web基础开发时候的期末作品——计算机学习网。当时刚开始学习HTML和CSS。 网站采用HTMLCSSJavaScript的架构设计,当时大概用了12天左右,当然这12天还在上其他的课,这是利用课余时间做的。网站包括主页、内容页、登录和注册页…

网站添加免费SSL证书——HTTPS协议

在添加证书之前首先了解两个概念:SSL和HTTPS。 ▶ SSL(Secure Sockets Layer 安全套接层),及其继任者传输层安全(Transport Layer Security,TLS)是为网络通信提供安全及数据完整性的一种安全协议。TLS与SSL在传输层与应用层之间对网络连接进行加密。 ▶ …

WordPress添加侧栏小工具-博客统计(网站统计)

WordPress侧边栏“博客统计”小工具的制作方法。首先要下载cztcms.zip文件,解压得到一个PHP文件。蓝奏云地址:▶ cztcms.zip 1、将这个PHP文件放到主题目录下。打开主题目录下的function.php,在最后一个 ?> 前插入以下代码: i…

PHP+MySQL实现精确统计网站访问量(IP个数)

基于WordPress的网站有很多统计功能。但是只能统计文章阅读数。不能统计访客人数。以下代码可以实现获取来访用户的IP地址,一个IP对应一次访问。即使刷新也不会增加访问量。这个非常精确。 1、创建一个存储数据的表。进入MySQL后直接创建即可。 create table wp_jc_…

gatsby_Gatsby更快的WordPress网站

gatsbyTalk about the latest cutting-edge web technologies, and you find some impressive names like React.js, Vue.js, Next.js, and so on. They have opened new gateways and approaches to building websites that can serve content to users quickly. 谈论最新的前…

从“奥运门票网站800万访问量”想到的成本、质量、进度、风险等关系

看到这个新闻后颇有一番滋味,更体验到我一直关注的软件性能着实无处不在,这个案例也确实值得我们好好反思一下。不知道网友们有没有报名参加国际日语考试的——这个网站每年05年前都有人不能报名,因为报名人数太多,所以报名当日大…

Web2.0网站的路径依赖--探讨蚂蚁社区为什么要导入博客

郑昀 2007-5-13以下文章即将讨论的问题涉及这几个关键词:l 网站启动的核心用户从哪里来?l 网站启动时需要什么样的种子用户?l 最初吸引来的种子用户对网站有什么路径依赖作用?麦田曾经问道:“4. …