现状分析
现代商品种类繁多,顾客往往会由于需要购买的商品众多而变得疲于选择,且顾客并不会因为商品选择丰富而选择购买更多的商品。例如,货架上有可口可乐和百事可乐,若顾客需要选购可乐若干,或许会同时购买两种可乐,但是购买可乐的数量大多数情况下不会因为品牌数量增加而增加。
繁杂的选购过程往往会给顾客疲惫的购物体验。对于某些商品,顾客会选择同时购买,如面包与牛奶、薯片与可乐等,当面包与牛奶或者薯片与可乐分布在商场的两侧,且距离十分遥远时,顾客购买的欲望就会减少,在时间紧迫的情况下顾客甚至会放弃购买某些计划购买的商品。相反,把牛奶与面包摆放在相邻的位置,既给顾客提供便利,提升购物体验,又提高顾客购买的概率,达到了促销的目的。
其次,许多商场以打折方式作为主要促销手段,以更少的利润为代价获得更高的销量。打折往往会使顾客增加原计划购买商品的数量,对于原计划不打算购买且不必要的商品,打折的吸引力远远不足。而正确的商品摆放却能提醒顾客购买某些必需品,甚至吸引他们购买感兴趣的商品。
综合商品零售行业现状,本案例需要完成以下分析目标:
1.分析商品热销情况和商品结构。
2.分析商品之间的关联性。
3.根据分析结果给出销售建议。
实施过程
某商品零售企业共收集了300030条购物篮数据,以下是字段说明:
字段名称 | 类型 | 字段说明 |
---|---|---|
id | 浮点型 | 用户ID |
卡号 | 浮点型 | |
消费额 | 浮点型 | |
付款方式 | 字符串 | 取值为{CHEQUE,CARD,CASH} |
性别 | 字符串 | 取值为{F,M} |
年龄 | 浮点型 | |
物品 | 字符串 |
数据接入
在实验中添加 数据源 节点,将购物篮数据读取进来,部分数据如图所示:
数据处理
根据本案例分析的是商品之间的关联性,需要收集到用户购买的物品列表,通过 聚合 节点根据用户id分组收集物品列表,如图所示:
输出结果如图:
通过 排序 节点,根据用户id进行排序,输出结果如图:
数据预处理流程图如图:
构建模型
经过特征选择物品列表一列,通过 拆分 节点按照7:3比例将数据集拆分为训练集和测试集。
最小支持度
支持度,代表项集的频繁程度;最小支持度作为支持度的阈值,满足最小支持度的项集才会输出。
最小置信度
置信度,代表包含A事务中同时包含B事务的频繁程度;最小置信度作为置信度的阈值,满足最小置信度的项集才会输出。
我们使用一个关联规则算法,这里选用 FP-Growth 算法 。整体的实验流程如图:
算法参数配置如图:
结果分析
如实验流程图所示,通过 模型系数 节点输出训练模型,输出结果如下:
预测结果如图:
通过模型的规则得出:顾客大多数比较喜欢购买蔬菜罐头、啤酒、冻肉等商品,并且在顾客购买啤酒的时候会同时购买冻肉、蔬菜罐头。
因此,商场应该根据实际情况将蔬菜罐头、啤酒等商品在顾客购买冻肉的必经之路,或者的显眼位置,方便顾客拿取。其他水果、鱼类、糖果等商品同时购买的概率较高,可以考虑捆绑销售,或者适当调整商场布置,将这些商品的距离尽量拉近,提升购物体验。
总结
本案例主要结合商品零售购物篮的案例,重点介绍了关联规则算法中的FP-Growth算法在商品零售购物篮分析案例中的应用。过程中详细的分析了商品零售的现状与问题,同时给出某商场的商品零售数据,分析了商品的热销程度,最后通过FP-Growth算法构建相应模型,并根据模型结果制定销售策略。