个性化捆绑销售推荐系统

文库 (48) 2021-04-23 18:03:17

1 概述
捆绑销售作为一种重要的销售策略,能帮助商家扩大销售,增加利润。个性化服务已经是一个互联网服务广泛采用的技术,个性化推荐音乐,个性化推荐商品,个性化新闻推送应用越来越多。将个性化技术与捆绑销售结合起来,可依据互联网获得的用户数据进行针对性更强的个性化定制商品捆绑和定价,可获得更高的销售量并获取更多利润。
当前针对捆绑销售的研究涉及捆绑销售的经济、管理决策及其影响,以及捆绑销售不同的策略选择。Adams and Yellen[1]研究捆绑模式下的福利水平,并奠定来捆绑销售的重要基础。Schmalensee则考虑了需求连续分布的情况,及分布对企业利润的影响。Wendi Hui考虑了顾客两种异质性,并分析不同情况下哪种捆绑策略更优。则Bitran则提出了一个捆绑组合,并且最优定价。为了更符合顾客心意,Hitt则提出了顾客白定义的捆绑组合方案。互联网发展使得个性化推荐得到广泛应用,个性化捆绑推荐策略变得更为容易和准确。Moran Beladev等提出的捆绑推荐中考虑了顾客个人消费特征对保留价格的影响,以进行个性化定价。Guannan Liu考虑用图来表示物品之间的关系,在此基础上来进行推荐。Tang Lei第一次提出了将推荐商品集做一个整体来进行研究。
本文提出并设计实现了一个个性化捆绑销售系统,系统由两大块组成,捆绑商品推荐部分和捆绑商品定价部分。捆绑商品推荐部分主要负责分析商品和用户信息,针对用户个性化推荐捆绑商品,而捆绑商品定价模块,对推荐的商品组进行综合定价。
2 系统模型
为个性化捆绑销售模型。
系统由两大块组成,捆绑商品推荐部分和捆绑商品定价。捆绑商品推荐部分主要负责分析商品和用户信息,針对用户个性化推荐捆绑商品,而捆绑商品定价模块,对推荐的商品组进行综合定价。
推荐部分主要由三个模块构成,商品模块、用户模块、推荐计算模块。商品模块和用户模块主要作为推荐的数据处理,推荐计算模块则是数据的计算,按照公式得出结果后,以TOP-N的方式向用户推荐前N项捆绑商品。
定价部分则由用户行为模块计算的用户行为,及推荐的TOP-N商品,个性化定价模块计算出推荐商品的捆绑定价。
2.1 商品模块
该模块主要功能有两块,一是筛选和转换商品数据,生成推荐系统能直接使用的lson数据,不同电商网站对商品的处理也不同,推荐系统建立中间层转换商品数据,之后的运算则不需要担心数据格式问题。二是依据商品数据计算商品杰卡德相似系数。商品杰卡德相似系数的计算需要将商品的一些属性标签化,这些属性包括商品自有属性和关于用户行为的属性。
部分属性可以直接转换为标签,比如商品的分类,在该推荐系统中,商品分类有三个层次,都可以直接作为商品的标签,部分属性则需要进行处理,比如价格,可将价格细分等级作为商品标签,等级的价格的跨度逐渐增大。用户行为也能作为商品标签的一部分,根据商品访问次数和购买次数,可以将商品的热度分级,再将商品热度增添至商品的标签中。
某些电商网站可供用户自定义商品标签,此类标签为大部分用户所承认,可以直接用作杰卡德相似系数的计算,商品的标签可以随时拓展和更新,以满足不同电商系统的需求,以及应对可能出现的特殊商品。
2.2 用户模块
用户模块主要做用户画像分析和用户皮尔逊相关系数计算,用户的购买行为,按商品的分类进行统计,作为计算用户皮尔逊相关系数的主要依据,用户画像则主要用于捆绑商品的定价,使用户对捆绑商品有较大的购买欲望。
用户画像分析的主要数据来源是用户行为,包括了购买记录、手机型号、手机系统、ip地址等数据,用户画像是动态的,所以也需要能随时更新与拓展。
2.3 推荐计算模块
推荐计算模块主要负责统计用户的购买数据,为计算商品杰卡德相似系数和用户皮尔逊相关系数提供依据,还有商品捆绑支持度和商品捆绑置信度的计算,该模块不对用户信息和商品信息进行任何调整操作,只进行数据统计和计算。
用户的购买数据也需要进行筛选,不能盲目地收集用户所有的信息,比如商品的集中频繁购买,少量数据的计算结果可能会有较大误差,但是垃圾数据和异常数据则可能直接导致计算结果错误,所以统计时需要有目的的筛选,筛选的规则是需要不断更新变化的,在统计过程中要预留拓展筛选的功能。
2.4 用户行为模块
用户行为模块主要用于补充用户画像。用户行为中包含了大量的用户信息,比如性别,购买记录和浏览记录的统计结果判断倾向,根据常用收货地址或者用户ip地址判断用户地区,以及根据用户的购买记录等判断用户购买力,根据当时未购买,短期内浏览或购买推荐商品辅助判断用户兴趣。
2.5 捆绑商品定价模块
捆绑商品的定价,可用收益期望来衡量是否最优。优惠的程度和用户购买的倾向是成正比的,用户购买欲望可以用指数函数来表示,我们认为价格的变化对购买概率的影响刚开始比较剧烈,随后变得平缓,这与指数函数分布的图像极为相似。当用户购买数据过少时,可从用户画像分析可推测用户的购买力区间,购买力区间是计算用户购买概率的重要因素之一。用户购买概率与捆绑商品利润的乘积,得到收益期望,计算得到最大的收益期望时的定价作为最终推荐捆绑商品的定价。   3 捆绑推荐策略
3.1 商品推荐策略
常用的推荐算法有基于内容[10]的推荐、基于内容的协同过滤、基于用户的协同过滤、基于标签的推荐等。在本文中,推荐算法一共使用了两种算法,基于商品属性的内容的推荐算法、和用户协同过滤推荐算法,通过计算用户相似度为用户分组,利用用户协同过滤,只统计相似用户的行为,计算商品置信度和支持度。
基于用户的协同过滤算法的主要推荐依据是用户皮尔逊相似系数,皮尔逊相关系数广泛用于度量两个变量之间的相关程度,其值介于一1与1之间。用户协同过滤推荐则计算用户的皮尔逊相关系数,通过统计用户购买行为,得到用户在每一个商品分类的购买次数,结合部分用户画像属性,比如性别,男生置为1,女生置为0,得到用户的相似矩阵,进行皮尔逊相似系数计算,最终得到相似度较高的用户组,再依据用户组中用户尚未接触的商品,进行捆绑商品置信度和商品支持度计算,按照80%置信度权值和20%支持度权值计算进行排序,获得新一组推荐商品,与上述基于商品内容的推荐算法得出推荐结果混合推荐给用户。
设E为数学期望,cov为协方差,σ为标准差,μ为均值。皮尔逊相关系数计算公式如下所示。
基于内容的推荐算法的主要推荐依据是商品杰卡德相关系数和捆绑商品置信度,计算商品杰卡德系数的指标有商品一级分类、商品二级分类、商品三级分类、商品品牌、价格等级、商品热度等级。
商品热度的统计依赖于用户的购买与浏览,用户购买行为相比于浏览更能表现商品热度,在统计热度时,购买行为的权重是浏览行为的两倍,商品的热度分为两种,总热度和实时热度,总热度需统计所有的用户行为数据,而实时热度只统计最近一周内的用户行为数据。
把商品标签放入集合中,得到商品的两个集合A和B,他们的交集元素的个数,在他们并集元素的个数中所占的比例,称为这两个集合的杰卡德相似系数。
杰卡德相似系数计算公式如下所示。
商品捆绑置信度为商品捆绑销售的可信度,揭示了用户购买A商品时,会不会同时购买B商品,如果会则其概率是多少。
商品捆绑支持度则为同时购买了A商品和B商品的用户比率,支持度没有先后之分,即A商品对于捆绑B商品销售的支持度,与B商品对于捆绑A商品销售的支持度是一样的。
捆绑商品置信度则是衡量是否能进行捆绑销售的重要依据,但依赖用户行为数据,当商品成交记录很少时,置信度和支持度误差极大,所以用户行为数据少时需要降低捆绑商品置信度对于推荐商品排序的权重。商品置信度是指购买了两种商品的人与购买了其中一种商品的比值。支持度是只同时购买了A和B的人数在总分的比例。
捆绑商品置信度C和支持度S的计算公式如下所示:假设捆绑商品的杰卡德相似系数为J,置信度为C,支持度为S,总用户数为U,总购买记录数为N,总商品数为G,商品热度为H,当用户行为数据过少时,商品置信度与支持度误差较大,α为调整参数,当用户行为过少时降低置信度与支持度权重,排序的计算公式如下所示。
按计算结果从大到小排序,值越大,推荐度越高,以TOP-N的形式推荐给用户。
3.2 捆绑定价策略
在定价策略中,用户购买力是一个重要参考指标。本文将用户的购买力分为六个层次,从低到高依次是:低、较低、中等、较高、高和超高。在计算用户购买力时,只计算了商品的大类。对于那些用户数据很少的用户,通过将用户分类,形成用户组的方式来预测他们的购买力,用户组的聚合主要是从两个维度,一是用户自身的属性,地域、性别、年龄等,二是用户浏览和购买记录。
用户购买力等级影响用户的购买欲望,当用户购买力等级越高时,价格对于用户购买欲望的影响相对减少,用户购买力等级高,其购买欲望下降得越快。
在不同的商品分类下,不同的价格代表了不同的购买力,比如一千元的T恤是高端的消费,但是一千元的电脑是非常低层次的消费,所以首先需要计算每个商品分类下各个购买力层次对应价格区间。本文系统将商品分类下所有商品价格从低到高排序,按照20%、30%、30%、15%、4%、1%,的比例分成六个层次,为每一件商品打上消费层次标签。
当用户购买数据过少,无法分析用户购买力等级时,通过用户画像寻找相似用户,使用前10位最相似用户的购买力等级均值作为该用户的购买力等级,用户相似度用皮尔逊相似系数衡量。
捆绑商品的定价主要计算捆绑商品的收益期望。在购买捆绑商品时,可认为用户绝对理性的,设商品A的价格为a,商品B的价格为b,用户在商品A收到与商品B的捆绑购买推荐时,当捆绑价格为a,用户购买的欲望无限趋于100%,当捆绑价格为a+b时,因为用户可以单独购买,所以此时用户购买捆绑商品组的欲望无限趋于0,符合指数函数的特征。在实际处理中,我们从两种商品中最小值变化到Pa+Pb即两种商品的价格之和。
用戶的购买力等级为n,用户对于捆绑商品价格为p时,幅度为7-n,购买欲望d的函数公式如下所示。
4 案例分析
我们将该系统用于国内微型某电商网站。用户数据57000条,商品数据8430条,商品一级分类28种,商品二级分类176种,商品三级分类715种,用户行为数据10141条,用户购买记录57000条。
运行该系统后,根据测试数据,我们对该系统的准确率、召回率、覆盖率、发现性、上新率等等各方面的指标进行了测试。
基于TOPlO测试结果显示,个性化捆绑销售系统在召回率、精确率、覆盖率、这三种评价指标上表现如表1所示。
5 结论
我们提出的这种捆绑推荐系统能提供用户购买力来进行用户分层,从而进行个性化定价,使商家能够扩大销量,并且在同种商品上可以获得更大利润。但系统用于测试数据量仍然较少,该电商属于微小型电商,购物数据不足,测试结果在更大应用场景下可能显示不同效果。捆绑销售的推荐精度相对难求,因为目前该电商的商品捆绑较少,我们的测试也未完全反映出客户在收到捆绑销售推荐信息时他们的反映情况,可以预料的是顾客收到信息,有可能引起对商品的关注,并且因为优惠的价格从而购买捆绑销售,则实际数据应该比测试数据更为乐观。但因为数据不够充分,所以对用户信息挖掘不够充分,将来的研究希望在足够数据支持下,挖掘到更大用户信息,以进行更为精确地推荐。也期待该个性化捆绑上线后能够获得更多数据来检验实验结果。

THE END

发表评论