浅谈国际信息流推荐

分享嘉宾：杰雄阿里巴巴

编辑整理：Hoh Xil

内容来源：大鱼技术沙龙

出品社区：DataFun

导读： 本次分享的主题是浅谈UC国际信息流推荐。会跟大家探讨下发链路中常见的一些问题，主要包括两个场景：

列表页排序，包括：目标确定、多目标任务以及混排组合优化。
内容冷启问题，如果不做内容理解，能否做好推荐系统？

▌列表页推荐

这是印度语版的推荐列表页，左边跟常见 feed 推荐的产品形态是非常类似的，有不同的异构的卡片：

新闻聚合页，点开以后就是一个聚合页。
视频，点开是一个沉浸式播放的聚合页。
普通的图文，点开是一个落地页、详情页。
Memes，印度市场特有的内容 Memes。这种内容主要是一张图片（或者动图），这种内容比较特殊，可以直接在列表页消费，直接看了就曝光、阅读完成，就结束了，如果点开的话就是 Memes 的沉浸式页面。

总结起来，内容消费的路径有：

一种是，列表页里直接消费的内容，如 Memes。
一种是，落地页中消费的内容。
还有就是通过聚合页再次跳到落地页消费的内容。

1. 目标确定

接下来讲下如何确定目标。对于推荐系统来说，最核心的就是如何确定目标，如果目标定不好，可能就会出现标题党的问题。在解释最终求解目标之前，先看下用户的行为路径：

图中圆圈表示的是用户的一种行为，方框表示用户发生这种行为的心里活动。

比如用户看到一篇内容之后，如果这个内容有吸引用户的点，也就是产生了吸引，会发生一次点击，在点击看到详情页的内容之后，如果对这个内容比较满意，用户可能会形成一次有效的阅读，有一次有效阅读之后，如果用户还是觉得这个内容非常好、非常满意，用户可能会有一些互动的行为，比如分享、点赞、评论等。

当然还有种可能：用户在列表页里看到一篇内容之后，用户不是很感兴趣，直接就跳走了或者快速的划过；再就是用户点开了一篇类似标题党的内容，但是内容完全不是用户想要的，这其实是一个强烈的不满意会，一个无效的阅读，然后用户就离开了。如果把所有不满意的行为看作是一种负向的满意度，我们建模的核心目标应该是一个用户累计的所有满意的行为，使满意行为累积量最大化。

这里所有标黄色的路径其实是一个偏正向的路径，标灰色的路径是个偏负向的路径，我们的目标是使正向的路径逐渐的累积，对用户逐渐的产生一个比较正向的影响。

所以求解目标是：

左边为吸引的概率，右边是满意的概率，然后所有看过的内容满意度最大化。

如何衡量有效的阅读？一个传统的方法是用阅读时长来衡量是不是一个满意的阅读，但实际上用户满意的心理和时长不是一个完全线性的关系。比如有一类行为是用户阅读了 5s 或者 10s 以下快速离开（quickback），这种无效阅读，无论是 3s、5s 还是 7s、8s，效果都是用户对内容完全不满意，应该快速离开的。再有，当用户读一篇长文时，大家可能都有这样的体会，长文阅读可能会有一个瓶颈，就是大家花了很长时间在一篇文章阅读上，但是读到一定程度的时候，可能再也读不下去了，能花的时间就存在一个极限了，所以最后满意度和时长关系是类似 sigmoid 的函数关系。因此，我们在对满意度建模时，其实是把回归问题变成了一个分类/二分类/多分类的问题。这里可能会涉及怎么做时长回归的问题（由于不同类型、分类、主题的内容以及内容信息量的不同，其阅读时长总量是会变化的），一种简单的方法是用这些维度，对内容进行统计分析求出分布，然后用分位数来截断，通过人工来排出几个档，也可以做一些人工标注来拟合这样的分类。结合UC国际信息流，稍微特殊的一点是列表页有 Memes 这样的图片内容。这种内容由于强调的是互动性（一般承载的是一些高分享类的内容，如早安、节日问候、搞笑的图片等），在产品设计时，会把这种交互行为做前置，在列表页就放出来，这样就可能存在误点，用户还没看到或看完这篇内容，就产生了点击，需要做一些过滤。

负向满意度，分为：

显式：很多产品在设计时，都会在内容边上有个XX，也就是 dislike，比较直白的显示了负向满意度。
隐式：无点的曝光、无效阅读 ( quickback )、快刷等动作。

说完了总的求解目标之后，这里列举的吸引和满意，满意还可以拆解成更多的步骤，比如刚才说的有效阅读和互动行为，可以再做分解，但无论如何都是一个多目标的任务，针对这样的多目标任务该如何建模呢？

2. 多目标点估计

这里列举了一些方法，都是阿里巴巴集团内部在各个业务线上的一些沉淀：

① ESMM：

这是阿里妈妈团队在解决多目标问题的一种解决方案。ESMM 可以解决我们在对多目标问题进行求解时，比如左边是转化率的目标，右边点击率目标，往往是独立进行求解的。使用样本时，该如何表达上文说到的转移概率？常规做法用到的样本，如转化率使用的样本是所有的有点样本，由于在训练时，使用的样本是部分样本，在预测目标时，使用的是全样本，导致样本分布会存在一定的偏差。ESMM 是把样本空间放到全空间，在定义目标，计算 loss 时，计算的都是全样本空间的 loss，一个是点击率，再有一个是把 CVR 作为一个中间节点，最后求解的 loss 目标是 CTR * CVR，然后底层网络参数共享。

② DBMTL：

DBMTL 模型是淘宝推荐团队对 ESMM 模型进行的改进。主要的改进点：左边这部分就相当于 ESMM 那张图横过来了，是共享参数层；specific layer 是走的不同目标的分支；最重要的是右边 bayesian layer，表达了概率图中目标之间的贝叶斯转移概率的因果关系。如果转移概率之间的关系，受其他的一些 feature 和因素的影响，也可以把那些 feature 加到网络中一起训练，所以 DBMTL 建模的时候还建模了几个目标之间的因果关系。

③ MMoE：

MMoE 类似一个专家系统，有多个子网络，每个子网络使用的特征和网络结构可以有差异，在最终确定多目标的时候进行票选，通过 gate 来赋予不同的权重来做票选。

最后，我们的业务在不同场景上都取得了比较正向的收益，如视频频道和 Push 场景。

多目标这儿写了一个点估计，因为主要用在精排的场景，在做每次的预估时，考虑的都还只是某一条内容的满意度效果。

3. 混排

但是在列表页场景，我们要求解的是一个组合最优的效果，也就是说对上面的问题需要做进一步的扩展。在考虑点击率时，还要考虑上下文，我上下文的信息。

然后我们的求解目标也做了一个转换：

U 转到 page，做了一个独立假设，认为页与页之间是没有关联关系的，但这个假设不一定成立，只是为了把问题简化一下。这样我们的问题就变成了在组合列表页的情况�

文章目录

See Also

最近文章

福利派送

分类

标签

友情链接

其它