闲鱼技术如何实现卖家增长任务的实验
逸初,远悠 闲鱼技术
背景
闲鱼是国内最大的二手闲置交易平台,卖家承担着商品供给的重要任务,对平台dau的影响也更大,所以我们会探索不同策略对卖家增长的影响与帮助。但接下来,如何借助AB实验对这些策略作科学的评估,就成了另一个挑战。本文提出了"全流量AB实验"这一设计,用于"实验对象在供给侧,且为浅库存"这样的约束场景下,完成了传统AB实验难以胜任的评测任务。
业务背景与传统AB方案
二手闲置交易是个特殊的电商场景,卖家并不通过招商引入(对比天猫平台的商家类型会有更直观的对比),而是以出售个人闲置的普通用户为主。相比于买家,这些卖家的交易与留存更值得关注,体现在以下几点:
1.卖家需求更迫切
买家购物的选择有很多,不买二手还可以买新品;但卖家不能成功售出,就是他的一个负担和资源浪费。
2.卖家决定着平台供给
若一个卖家未能售出,则直接影响下一次商品发布的积极性,损失了潜在的供给,且闲鱼平台不少类目呈现供小于需的状态。
3.卖家成交比买家成交的留存增益更高
相应地,卖家完成交易,认可闲鱼平台真的能帮助一般卖家发布和销售闲置商品后,可以让用户对平台更易形成依赖与粘性。接下来,如何对卖家策略作AB实验,是一个新的挑战。为什么这么说,先让我们回顾下传统的AB实验设计。
AB实验是互联网各厂主流的一种策略评估手段。比如一个推荐系统想迭代一次ctr预估模型,就可以对流量作随机分组,不同分组使用不同的ctr预估模型,然后观察用户日志作数据回收。这样就完成了一次随机对照实验(RCT,RandomizedControlledTrial)。根据实际数据得到客观、量化的策略效果影响,为产品迭代提供精准的指导。那如何实现AB实验呢? 最简单的,按照请求id对流量作随机划分,此时同一用户的多次请求会落到不同的实验分组中,每个实验桶可以实验不同的参数模型预估ctr,由于流量是随机划分的所以每个实验是统计独立的,从中可以挑选效果最好的模型。电商场景下,关注的已不只是ctr这样单纯的流量指标,而是以人为维度的uv指标,如买家的人均订单数以及uv留存等,所以实验流量的划分会更进一步,从"请求id"变为"买家id"为维度。闲鱼搜索场景也是如此,见图1。
图1.一般ab实验框图
在图1这样的设计下,可以满足对买家的实验控制,如迭代一版交互ui,或者一版搜索相关性模型等。但现在实验的对象是卖家,我们简单作角色替换行不行? 答案是否定的,因为我们永远不可能像买家划分那样,同一个卖家只能出现在某一个流量桶中,这样相当于搜索候选池缩小至1/N(N为划分的桶数),成交势必严重下跌。目前有一些其他的折中设计,但也不完美,列举如下。一种是以类目作为流量的划分依据。即根据query所属类目的不同,来区分对控制组与实验组。它的不足之处在于不同类目的供需关系及成交效率天然就会存在差异,难以做到随机分组的要求。还有一种做法是隔天实验,即T日流量使用控制策略,T+1日流量使用实验策略,T+2日再使用控制策略,这样交替进行,即相当于把时间当做划分依据。但是这种设计有两处不足:1)太过理想化,忽略了不同时间本身可能就是一个影响因子,如周末,节假日,app更新等都会影响到用户表现;2)当观察指标本身涉及到时间时,比如长期留存,它就要求同一个用户下不同时间的策略也要一致。在提出全流量AB实验的设计思想前,我们先列出一个具有说服力的AB实验需要满足的条件。
具有说服力的AB实验应遵循的准则
1.同一个商品/卖家,不能因流量桶不同而出现策略差异
传统AB实验,同一个买家只能落到确定的一个桶里,就是为了保障策略的固定性,否则多个实验策略叠加一起,影响准确归因。这里也一样,同一个卖家不能同时受到多种分发策略的影响,破坏AB实验的单一变量原则。
2.供给配额要与流量分配一致,否则易出现推全收益低于ab收益,ab参考价值有折扣
假设有个实验策略相比对照组有改进,该策略对某些受到低估的商品集合A(1万量级)预估得更准了,单桶AB下拿到了成交+5%的收益,但由于集合A较小,且闲鱼因出售的是个人闲置,浅库存特性显著,一个桶的流量已足以把它们消耗完毕,实验扩大到两个桶后,由于相互竞争,收益会降至+2.5%,推全后收益更加不显著,如此则丧失了AB实验 “收益客观且具有推全后一致性” 的参考意义。
3.干预策略不要伤害到对照组。
这个很直观,比如对实验组的目标商品加权时,对照组的商品不应该受此影响被挤到后面。
全流量AB实验的设计
与以上三个准则呼应,我们对搜索结果页的卖家id作流量划分,对比见图2。
图2.全流量AB实验设计思想
1.全流量桶AB。所有买家桶中都是一样的代码。这些代码自带卖家分组的if-else逻辑。
常规AB:实验组与对照组来自不同买家之间请求粒度的流量划分;全流量AB实验:实验组与对照组来自搜索结果页不同卖家之间坑位粒度的流量划分,因卖家实验组策略会出现在所有流量分桶中,故名 全流量AB实验。
2.供给分组与流量分组均为50%,保持一致
离线对卖家id作哈希划分,如作二等分。因为是随机划分,所以搜索结果页中,实验组卖家的流量也应该是50%,这就满足了供给与分发配额一致的要求。
3.排序策略的干预只在实验组流量内进行,对照组不受干扰。
因为实验组与对照组在同一搜索结果页中,所以对目标商品加权时要额外留意。
应用案例:流失卖家倾斜
任务背景
表1.流失卖家与新卖家受到聊天(买家点"我想要"发起询单)激励后,留存增益显著
所以从留存价值考虑,对当日到访的且未受到我想要激励的新/流失卖家,作流量倾斜实验,为什么不直接选成交呢,因为"商品曝光->询单"的转化率为"商品曝光->成交"的转化率的10倍,意味着可以节省流量扶持更多目标卖家。
全流量AB实操
除了章节二中的理由外,当日到访新卖家总共才1万量级,不做全流量AB,影响到的uv过少,波动会是个大的干扰。见图3。此时我们要对比的就是,A1卖家相较B1卖家,在聊天uv,成交uv,留存效果上的提升。
图3.全流量卖家AB在流失卖家倾斜实验中的案例
4.3实验结果
目标卖家扶持的有效性
表2.全流量AB实验5天数据见下。收到"聊天"激励的卖家uv占比提升了+22%,符合预期。
验证扶持后对整体的交易效率有无伤害
既然是扶持,意味着此前排序靠后的商品加权排在了前面,那是否真的会影响整体的人均买卖家指标呢? 下表显示实验组的人均买卖家反而有提升。5日平均人均买卖家提升了+1%(如下表3)
需要进一步印证。查看扶持后新卖家商品的ctcvr,流失卖家商品的ctcvr,均高�
- 原文作者:知识铺
- 原文链接:https://index.zshipu.com/geek/post/%E4%BA%92%E8%81%94%E7%BD%91/%E9%97%B2%E9%B1%BC%E6%8A%80%E6%9C%AF%E5%A6%82%E4%BD%95%E5%AE%9E%E7%8E%B0%E5%8D%96%E5%AE%B6%E5%A2%9E%E9%95%BF%E4%BB%BB%E5%8A%A1%E7%9A%84%E5%AE%9E%E9%AA%8C/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。
- 免责声明:本页面内容均来源于站内编辑发布,部分信息来源互联网,并不意味着本站赞同其观点或者证实其内容的真实性,如涉及版权等问题,请立即联系客服进行更改或删除,保证您的合法权益。转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。也可以邮件至 sblig@126.com