先用knn对数据集进行预处理再利用神经网络对数据集进行分类_网站数据分析— 常用商品运营分析模型分享...

news/2024/5/20 1:09:31/文章来源:https://blog.csdn.net/weixin_39583162/article/details/110216229
24943cbf76bf63082608496db2f2376b.gif点击上方蓝色字关注我们~

来源掘金

本节将介绍几个常用的商品分析模型,包括商品价格敏感度模型、新产品市场定位模型、销售预测模型、商品关联销售模型、异常订单检测模型、商品规划的最优组合。

1

商品价格敏感度模型

商品价格敏感度模型是指通过研究找到用户对于价格是否敏感以及敏感程度的价格杠杆。利用价格敏感度模型可以辅助于销售定价,促销活动的折扣方式、参考价格、价格变动幅度等方面的参考。

例如:

促销活动时是否应该包含M2商品;当商品M3提价100元时,订单量会如何变化;在商品详情页的参考价格应该定为多少才能让客户感觉到已经降价并触发下单动作;满减、满返、跨品类用券等哪些方式最适合M4商品。

商品价格敏感度分析可以通过两种方式实现:

1.调研问卷法

通过调研问卷的形式针对关注的品类或商品做调研分析是比较通用的一种方法。这种方法可以获得品类详细信息,并且可以通过问卷设置不同的关注信息点,收集到的信息更符合实际需求。

但是,当面临新的价格敏感度分析需求时,通常都需要重新开展调研分析工作。这种方式实施起来周期较长且反馈结果较慢,另外,当要收集的商品信息较多时,可能很难获得完整数据。

2.数据建模法

通过数据建模的方式建立商品价格和销售量之间的关系模型是研究价格敏感度的有效方法。

这种方法实施起来相对简单:

首先,收集不同价格下的销售数据。价格敏感度模型需要有基于不同价格下的销售数据产生,因此需要商品运营部门针对性的做调价。这种调价动作根据需求的不同,可能是长期的,也可能是短期的。

长期的调价是一种“自然状态”,因为在一个较长周期内商品会经历生命周期的不同阶段,并结合商品促销、打折等运营工作产生多种价格和销售数据;而短期的调价更多的是为了采集数据而产生。

其次,数据建模分析。商品价格敏感度模型关注的主要是价格和销量之间的关系,可以用回归方法来解决。在回归方法中,自变量中除了价格外,还需要包含其他两类信息:

  • 商品信息,商品品类、上市时间、同期竞争对手价格、是否参与促销活动、促销方式、折扣力度、通用属性等。

  • 客户信息,客户性别、年龄、收入、学历、会员级别、历史订单量、品类偏好度、活跃度、价值度等。

之所以要将大量的商品信息和客户信息加入到回归模型中,是因为如果只针对价格和商品销售量做回归,那么价格本身能解释的商品销售量变化可能会非常有限,销量的变化还可能受到其他很多因素的影响,因此要在控制这些干扰因素的前提下做回归模型

2

新产品市场定位模型

新产品市场定位分析用于当企业新生产或策划一款产品时,需要根据市场上现有的竞争对手产品情况定位分析

该分析的目的是评估新产品与哪些产品能形成竞品关系,可以针对性地找到与竞品的差异性和优势,例如功能特点、使用周期、产品质量等,从而应用到产品定价、市场宣传、渠道推广等方面。

新产品市场定位分析可以通过基于相似度的方法实现。

例如:使用非监督式的KNN(K近邻),模型的核心是通过对新产品的数据与现有数据的比较,发现跟新产品相似的其他产品。

通过KNN实现新产品市场定位分析的步骤如下:

  • 步骤1:数据准备。先准备好要训练的数据集,由于这不是一个分类应用,因此数据集中只包含不同竞品的特征变量即可,无需目标变量。

  • 步骤2:数据预处理。预处理过程根据数据集情况可能包括二值化标志转换、缺失值处理、异常值处理、数据标准化等。需要注意的是, 由于是基于距离的计算,分类和顺序变量需要做二值化转换,异常值(包括量纲和值的异常)都会对相似度产生重大影响。

  • 步骤3:建立KNN模型并训练模型。直接使用NearestNeighbors方法建立模型后使用fit方法做训练。

  • 步骤4:找到新产品最近的K个相似产品。使用KNN模型的 kneighbors方法获得指定数量的K个近邻。

如下是一段简单但包含了核心步骤的示例:

from sklearn.neighbors 

结果:

(array([[ 0.80622577]]), array([[2]]))
  • 第一个数字是与新产品数据最相似的产品的距离

  • 第二个数字是对应最相似产品记录的索引值(注意索引值从0开始,2表达第三个)

3

销售预测模型

销售预测模型根据历史的销售数据来预测未来可能产生的销售情况。该模型常用于促销活动前的费用申请、目标制定、活动策略等的辅助支持。

销售预测模型通常要得到的结果为未来会产生多少销售量、收入、订单量等具体数值,可通过时间序列、回归和分类三种方法实现。

  • 基于时间序列做销售预测。使用时间序列做销售预测的方法常用于没有太多可用的自变量的场景下,只能基于历史的销售数据做预测性分析。有关时间序列的更多话题,后面再讲。

  • 基于回归做销售预测。基于可控的特征变量建立回归模型来预测未来的销售情况是更常用的方法,有关回归模型的更多内容,后面再讲。

  • 基于分类做销售预测。分类方法是针对每个销售客户产生的是否购买的预测分类,然后再基于能产生购买的预测分类做客单价、订单量和收入的分析。这是一种对于具体数值的变通实现思路。有关分类分析的更多内容,后面再讲。

4

商品关联销售模型

商品关联销售模型主要用来解决哪些商品可以一起售卖或不能一起打包组合的问题。关联销售是商品销售的常态,也是促进单次销售收入和拉升复购效果的有效手段。

商品关联销售模型的实现方式是关联类算法,包括Apriori、FP-Growth、PrefixSpan、SPADE、AprioriAll、AprioriSome等,主要实现的是基于一次订单内的交叉销售以及基于时间序列的关联销售。

关联销售算法的实现步骤上与普通的监督式和监督式算法略有不同,原因是关联分析对于数据集的要求不同。一般包括三种数据源格式:

  • 第一种是事务型交易数据,典型的数据格式是每个数据行以订单 ID或客户ID作为关联分析的参照维度,如果同一个订单内有多少个商品,那么将会有多个数据行记录,如下图:

95174a8496c36f2cbc616ba9c7d636ed.png
  • 第二种是合并后的交易数据,数据格式是每个数据行以订单ID或客户ID作为分析的参照维度,如果同一个订单内有多个商品,那么多个商品会被合并到一条记录中,如下图:

b0c0326626925b1a563470c9f3faaced.png
  • 第三种是真值表格数据,每个数据行是每个订单ID或客户ID,列是每个要关联项目的是否购买值,通常以T或F来表示,如下图:

4ba33197d295c23836f79da526c22170.png

以上三种数据格式中,第一种和第二种常见于企业内部的源数据环境或数据仓库,第三种需要经过ETL处理得到,很多第三方工具也可以提供这种数据形式。如果企业内不具备能够直接做关联分析的数据,则需要做对应处理。

5

异常订单检测

异常订单检测用来识别在订单(尤其是促销活动中的订单)中的异常状态,目标找到非普通用户的订单记录,例如黄牛订单、恶意订单、商家刷单等。

  • 黄牛订单会大量削减促销对普通用户的吸引程度,使得促销权益和利益被一小部分人获取,而非给到目标会员。

  • 恶意订单则更加危险,很多竞争对手间会通常这种方式在促销活动中,将大量的商品库存通过订单的方式锁定,然后再活动结束后通过取消、退货等方式释放库存。这种方式将使促销活动由于无法真正卖出商品而无法实现促销的目的,同时还会消耗公司大量的人力、物力,是各个公司都非常反感的恶意竞争方式。

  • 商家刷单是一种常见的用于提升商家排名的方式,通常由商家来安排内部或关联人员大量购买商品,以形成商家流量和销售提升的目的。

异常订单检测主要基于两类方法实现:

  • 基于监督式的分类算法:将历史已经识别出来的真实异常订单数据通过分类模型(例如SVM、随机森林等)做训练,然后应用新数据做分类预测,看预测结果是否属于异常订单。

  • 基于非监督式的算法:通过非监督式算法(例如OneClassSVM)基于历史的数据做训练,然后针对新的数据做判别,找到存在异常可能性标签的订单列表。

6

商品规划的最优组合

在做商品促销或广告宣传时,通常企业会面临多种组合策略,它是在一定限制条件下考虑通过何种组合策略来实现最大或最小目标。此时,可以考虑使用线性规划方法

线性规划(Linear programming,LP)是运筹学中研究比较早、方式相对成熟且实用性非常强的研究领域,主要用来辅助人们进行科学管理,目标是合理地利用有限的人力、物力、财力等资源作出的最优决策。

解决简单线性规划问题的最直接的方法是图解法,即借助直线与平面区域的交点求解直线在y轴上的截距的最大值或最小值。

在做线性规划时涉及几个概念:

  • 未知数:影响决策主要变量或因素。

  • 约束条件:解决线性规划问题时已知的并须遵守的前提条件。

  • 目标函数:用来表示未知数与目标变量关系的函数,线性规划中一般是线性函数。

  • 可行域:满足优化问题约束条件的解叫作可行解,由所有可行解组成的集合叫作可行域。

  • 最优解:满足目标函数最大化或最小化目标的最优的解。

实现线性规划的基本步骤如下:

  • 步骤1:找到影响目标的主要因素,它们是规划中的未知数。

  • 步骤2:基于未知数确定线性约束条件。

  • 步骤3:由未知数和目标之间的关系确定目标函数。

  • 步骤4:找到直角坐标系中的可行域。

  • 步骤5:在可行域内求目标函数的最优解及最优值。

为了能清晰地表达上述概念和步骤,在此通过一个简单的示例演示该过程。

假设公司有P1和P2两种商品,当推广P1商品时,每次费用为60元;当推广P2商品时,每次费用为30元。现在公司有1800元预算可以用来做P1和P2商品推广,其中受到两种商品尺寸和品类的限制,P1商品最多只能投放20次,P2商品最多只能投放40次,并且两种商品的总投放次数不超过45次。已知每次推广P1和P2的商品分别能获得单品毛利为40元和30元,

问:如何安排P1和P2的商品投放次数才能达到销售毛利最大化目标?

为了解决问题,我们假设P1和P2两种商品的投放次数分别是X1和X2,最大化销售毛利为z,此时:

3c8237cf565f875187c9de3cdde399d2.png

由于这是一个简单二维变量,因此可以先画出直角坐标图和可行域,然后基于目标函数找到最优解位置

9858adee56b7155160e471589ea236e1.png

通过图可以发现最优解是目标函数与X1+X2=45和60X1+30X2=1800的交点,求解两个函数的解用到的是九年义务教育阶段基本数学知识。

57c0e318716d8f1f9f556add4f343909.png
  • 步骤1:将等式1做转换:X1=45-X2 然后将转换后的X1代入等式2,并依次求解:

  • 步骤2:60(45-X2)+30X2=1800

  • 步骤3:2700-60X2+30X2=1800

  • 步骤4:2700-30X2=1800

  • 步骤5:30X2=900

  • 步骤6:X2=30

  • 步骤7:X1=45-30=15

  • 步骤8:然后将X1和X2带入目标函数:z=40X1+30X2=40×15+30×30=1500

如果线性规划中有多个变量,那么我们无法通过图形的方式直接发现最优值的位置,此时可以借助Python的线性规划库来完成线性求解工作,包括scipy、optimize、linprog、pulp等。

原文链接:

https://juejin.im/post/6844903967416123399

END -

本文为转载分享&推荐阅读,若侵权请联系后台删除

推荐阅读

  • 数据分析越来越火,如何做一个靠谱的职业规划?

  • 不会这5个Excel函数,不好意思说会做数据分析

  • 分析数万条旅游评论数据后,告诉你国庆“坑爹”景点背后的秘密......

04e09bfe69693265810204140f1bbe6b.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_781834.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

景安vps网站上传后前台能打开后台不能打开_一次某系统的后台拿shell过程

0x01 前言这个后台是一个表哥给我的,然后作为菜鸡的我去试着弄了一下,搞下了,就分享一下思路,文章很菜,希望各位大表哥手下留情,别喷~(菜鸡第一次在春秋写文章....)0x02 测试开始首先,后台界面是…

网站访问量怎么刷_基于爬虫刷新某网站访问量!我说怎么上千万呢!

前言:前一段时间看到有博友写了爬虫去刷新博客访问量一篇文章,当时还觉得蛮有意思的,就保存了一下,但是当我昨天准备复现的时候居然发现文章404了。所以本篇文章仅供学习交流,严禁用于商业用途当我在写文章的同时&…

html图片预加载 博客,网站预加载JS脚本 instant.page

本篇文章介绍了一个网站预加载的脚本 instant.page作用是可以预加载用户想访问的页面,当用户真正点击链接后,就会直接从缓存中读取,以此提升网站的访问速度。原理介绍及作用在逛夏目友人帐的网站时无意间看到这样一个脚本,号称可以…

php动态刷新div_网站SEO优化动态URL与静态URL

网站的URL被分为动态和静态两种,因为程序语句不同,动态的URL也分为三种,第一种是ASP,第二种是PHP,第三种是JSP。静态的URL却只有一种,那就是.html。所以,我们经常通过网址来查看该网站是动态还是…

网站开发需要哪些技术_开发网站需要什么软件及技术?

网站大家都非常熟悉,但是网站是怎么做出来的?需要用什么软件?都有哪些步骤?很多人就不清楚了!网站制作的时候,需要分析网站需求、确定网站主题、规划网站页面等等,需要确定好网站整体风格&#…

php css加权重,新站如何提高网站权重

新站提高网站权重的方法:1、增加高质量外链;2、提高原创文章的质量;3、在权重较高的网站发布外链;4、降低导出链接;5、将首页的权重引导至比较重要的页面。新网站如果没有权重的话就会很难获得排名,那么新站…

网站页面加载性能测试工具

网站页面加载性能测试工具 1、Yahoo:Yslow(为什么慢?) 门户网站页面加载性能测试工具---YSLOW 【转自】http://www.blogjava.net/lijun_li/archive/2009/06/21/283458.html 目前我知道的用于测试B/S结构,页面加载性能…

优化网站性能 提高网站速度访问速度的14条实践

优化网站性能 提高网站速度访问速度的14条实践 http://hi.baidu.com/lxll2009/blog/item/9e040d50d6c3c5828d54304e.html 第一条、尽可能的减少 HTTP 的请求数 (Make Fewer HTTP Requests ) http请求是要开销的,想办法减少请求数自然可以提高…

PHP虚拟主机放置多个站点,三种方法实现一个虚拟主机【网站空间】放多个网站...

有些朋友为了省钱需要在一个云虚拟主机上安装多个网站,所以在空间上绑定了好几个域名,但是访问到的却是相同的内容,怎么样让不同的域名访问不同的内容呢?[虚拟主机本身支持子目录绑定域名的不在讨论之列]方法一:(这种方…

Silverlight应用的SEO优化

译文,来源:http://blogs.msdn.com/waldred/archive/2009/03/23/Search-Engine-Optimization-for-Silverlight-Applications.aspx 点击下载源码 简介 对于你来说创建下一代的富应用,使用有无数的理由。但是有一个缺点就是使用呈现的内容无法被…

Asp.Net 网站优化 数据库优化措施 使用主从库(上)

网站规模到了一定程度之后,该分的也分了,该优化的也做了优化,但是还是不能满足业务上对性能的要求;这时候我们可以考虑使用主从库。 主从库是两台服务器上的两个数据库,主库以最快的速度做增删改操作最新数据的查询操作…

10款精选的用于构建良好易用性网站的jQuery插件

这篇随笔收集了10款非常给力的jquery 插件,帮助你构建易用性良好的网站,希望对你有用! Embedded help system 看过该插件demo后,感叹道,真是太棒了! 点demo里的How to下面的几个链接看看效果:) Embedded …

网站导航颜色停留_专业的网站设计的技巧有哪些?

当我们打开网站时给我们印象最深刻的就是网站的页面设计,有的网站设计的十分大气,有的网页设计的眼花缭乱的,一样都是网页,但给用户带来视觉体验效果是完全不一样的,一个具备新意的网站设计可以带来与众不同的感觉&…

简单的物流管理网站制作源码_物流网站制作需要注意些什么?

现在的物流公司越来越多,而物流公司的网站制作也使得很多物流公司找到了很好的合作伙伴,并且还特别快速的捕捉到了商机,捷路科技网站建设服务商认为物流网站的制作成为物流公司便捷交易的一种手段,更是物流公司发展的必备&#xf…

分享道,可以包含分享几乎所有的网站的按钮

2019独角兽企业重金招聘Python工程师标准>>> 分享道,可以包含分享几乎所有的网站的按钮 这里记录一下,网址为http://www.shareto.com.cn/getcode.html 转载于:https://my.oschina.net/zhangdapeng89/blog/38062

网站分析度量

网站分析度量 今天的话题回到度量,因为度量是网站分析的骨骼,所谓皮之不存毛将焉附,没有度量,网站分析就成为不了一门科学。度量也是最多朋友们问起的问题,例如下面这个问题: 宋星老师: 有个困惑…

大型网站用户定位技术(智能 DNS 和 IP 重定向)

其实这个文章叫大型网站用户定位技术,其实今天要讲的不是智能 DNS ,今天是要讲的智能 DNS 的问题,和一些网站对这个的处理,下面要讲的这个技术主要是针对比较大的文件,比如下载和视频之类。为什么要讲这个,主要是我的群…

25个互动看起来如Flash的HTML网站

还记得那些很酷的互动媒体闪光灯内置丰富的网站?他们往往会采用全屏布局,动画元素。不幸的是flash带来的各种问题无法获得较高的处理器负载,今天就给大家推荐由HTML5,CSS3和Javascript库创作的html网站,效果跟flash一样…

winform怎么向网站发送json_Python除了做爬虫抓数据还能做什么?其实还能监视和衡量网站性能...

借助这份对初学者友好的指南,您可以构建自己的自定义Python脚本来自动测量网站的关键速度和性能指标。在过去的一个月中,Google宣布了许多通过关键速度和性能指标来衡量用户体验的方法。巧合的是,我一直在努力编写一个Python脚本,…

网站互点工具_如何利用关键词互点互刷提升网站关键词排名?

最近老是点击一个网站进去看,几天后发现关键词排名提高了,就在想是不是通过点击网站可以提高关键词排名了?网上不是有好多朋友都在寻求关键词互点,而且要求点击某篇文章,并且要在页面停留多少分钟,说这样才…