▌2.1数据层面

▏2.1.1「稀疏性」:稳定的流量与稳定的交互比例(pv/uv)

稳定的 「流量」 与稳定的 「交互」「比例」 保证了数据的 「稠密性」 ,单用户和单商品有 「足够的数据」 可以完成机器学习,并且保证一定的 「置信度」 。当有 「新用户(新商品)」 加入系统时,由于系统中缺乏用户(商品)历史反馈信息,所以完全无法推断用户的偏好,也就无法做出预测。 稀疏性主要指用户反馈数据的量级与本身条目量级的对比,如果这两个 「量级差异」 过大,则会导致模型容易受到 「随机因子」影响。

2.1.2时效性:能够获得快速反馈

首先你的产品必然需要具备 「快速获取用户反馈的能力」,推荐产品必然需要随着用户走,如果用户反馈有较大的 「delay」,必然带来体验和效果上的 「大打折扣」。而对于反馈的获取,主要是在数据收集及处理上,并且最终作为燃料送入算法,产出用户所需的推荐。 用户行为数据越快被反馈的产品推荐效果更明显:因为 「用户的兴趣是变化的」,通过机器学习来推敲用户的兴趣所需的物料就是数据,如果你能够快速地反馈用户行为数据,那算法模型就能够 「实时地捕捉用户变化着地兴趣」,当然效果就自然而然明显。

▏2.1.3多样性与稀疏性:条目增长相对稳定、条目的类别多样

「多样的类别」 可以从不同的角度满足用户,商品量越大,类目越多,推荐的 「价值就越大」 。条目增长稳定主要指产品所持有的可推荐物料,因为对于推荐而言,条目作为信息载体,如果增长不稳定,最根本的 「物料缺乏」 ,可能导致 「新颖性降低」 。如果本身条目池长期数量有限的话,那很难带来良好的推荐体验,因为本身推荐也是信息爆炸下的产物。 如果产品本身条目增长不稳定,那么 「大量新条目」 地涌入会使 「冷启动非常明显」 ,而条目 「增长过缓」 会导致 「多样性问题」 ,推荐无法很好地从有限的池子中挑选适合用户的条目, 因为往往时效性在推荐系统中有较明显的影响, 「历史物料无法长期提供高价值」

▏2.1.4数据收集情况

「关键数据缺失」「数据收集不规范」 等无法给给出准确及时的数据,也会大大影响推荐系统的效果。

▌2.2产品层面

▏2.2.1推荐是锦上添花

围绕产品的核心目标进行的推荐才是有价值的, 「 产品是推荐的载体」, 用现在的话说就是**「帮产品搞事情」**。

推荐“搞事情”的目的有2点:

「让产品活的更久」:活的久是要延长产品的生命周期,延长用户的生命的周期,更受用户喜欢。

「让产品活的更好」:活的更好就是通过广告、用户主动付费等方式获得收入,带来商业价值。

本质上产品需要将整个用户行为路径进行优化,比如电商产品,在推荐的场景需要考虑 「展现形态」 ,包括图片和文字简介,购物链路上的商品详情页的描述信息丰富和核心程度,整体布局等等。去伪存精,通过信息表达需要考虑 「基础信息区」(回答商品是什么,吸引决策); 「优惠」(有没有优惠,刺激决策);「服务区」 (有没有保障,加固决策);「参数规格区」(有哪些可选,完成决策);「评价区」(大家怎么说,辅助决策);「后续推荐卡片」(再逛逛别的,流量再分发)。

▏2.2.2推荐是帮助用户感知,而不是强迫TA思考

在推荐产品的整个构建过程中,永远需要记住的是你需要 「帮助用户感知」 ,而 「不是将过多的主观想法强加于他」「不是替他思考」 。推荐通过收集用户数据,并对用户意图及行为路径建模,从而建立整体用户认知,将条目作为认知的载体呈现给用户,让用户进行体验交互,并进一步收集用户反馈,并假设用户有正向反馈的商品是用户表现出价值认可的。在此基础上,我们可以让用户 「持续留存」 ,并且建立一定的 「情感链接」

▏2.3.3全局&系统工程

推荐是一个系统工程 , 「从业务经验出发」 ,围绕 「数据」、「产品形态」、「算法」 进行 「协同优化」 才能带来更大的收益。用户体验的满意程度贯穿于整个产品使用过程中,如果想要有好的推荐结果,必然需要 「全局」 去思考并优化。

「推荐时机」: 由于兴趣发现和收敛速度的原因,对于智能程度的感知也随时间会产生较大的变化,合适的时机能够带来更大的收益。

「推荐质量」: 对于不同的产品,内容时效性和列表新颖性有不一样的要求,对于不同领域的产品,质量也有不一样的定义。

「多样性」: 对于推荐而言,既要满足用户行为中的正负反馈,又要给予用户更加多样的列表。

「产品定位」:  「不同位置的推荐产品定位不同」 ,「跳出局部最优思想」,做「全局最优化」,永远是「场景间协同」,根据「行为路径的差异」,「行为深度的差异」来做「差异化的场景设置」 。比如单品页:购买意图,过渡页:提高客单价,购物车页:购物决策,无结果页:减少跳出率,订单完成页:交叉销售,关注推荐:提高转化,我的xx推荐:提高忠诚度。

▌2.3用户维度

「推荐系统为用户服务」,产品所面向的不同类型用户很大程度会影响推荐系统的效果。如**「新老用户占比」 ,即营销引流与用户留存的情况所影响的占比,新用户在冷启动上会需要花费更多的时间,因为新用户通常是那些没有行为或者行为过少的用户,本质还是数据稀疏问题带来的困难,初期可以用冷启动的一些方法来进行推荐,最终最有效的方式是将新用户留下来,将新用户培养成老用户;「不同性别用户的占比」**,这个主要体现在用户的行为性别,因为不同性别的人在使用产品过程中的差异非常大,对体验好坏的体感也有较大差异。

▌2.4架构维度

架构设计 「对问题排查监控的影响」 。老司机们都知道,只能跑不能修的车是肯定不能上路的。同理,推荐系统的整体架构设计要对问题的排查比较友好,能够在出现问题或者需要验证猜想的时候能够快速在系统中进行定位,而不是现加debug信息现上线,导致问题排查过程被拖长。优秀的工程师会在系统设计的时候就给自己留好后路,而不是在出了问题时才临时抱佛脚。

架构设计对 「迭代速度的影响」 。除了响应速度这种较为表面的影响以外,整个架构的设计能否支持快速的策略迭代对效果的隐形影响也是极大的。如果整体架构比较臃肿,模块分离不清晰,基础逻辑缺乏适当抽象同一,会导致数据和策略的迭代无法快速进行,每迭代一次都要走很复杂的流程,而且还不能保证正确性。这样的问题会拖累系统的发展速度,最终影响效果。

▌2.4完美的推荐

▏2.4.1技术本质&根源:f(场+人+货)=rate

从前几章的介绍, 我们可以了解到, 本质上我们需要通过业务构建一个用户对商品的评价模型(函数), 不同的人在不同的场景下, 对不同的物料有不同的偏好及需求度, 如果我们精确地构建了对这种需求的定量衡量, 则我们只需要将那些用户需求�