2022年3月15日
作者:Mihajlo Grbovic 编译:ronghuaiyang 英文原文: https://medium.com/airbnb-engineering/listing-embeddings-for-similar-listing-recommendations-and-real-time-personalization-in-search-601172f7603e 导读: 这是Airbnb的一篇经典文章的解读,使用房屋的嵌入来做搜索推荐,这篇文章也是KDD2018的best paper,思路很清楚:把房屋用嵌入向量来表示,两个技巧:全局正样本和市场内负采样,很有效,离线评估指标:预……
阅读全文
2022年3月15日
分享嘉宾:杜宝坤 京东 资深算法专家 编辑整理:侯雅新 出品平台:DataFunTalk 导读: 对于AI飞速发展的今天来说,大规模的多维度、高质量的数据是其成功的关键要素,也是制约其进一步发展的重要瓶颈。随着大家对数据的重要性与隐私性的认知程度的不断提升,跨组织的数据的合作越来越谨慎,相关……
阅读全文
2022年3月15日
作者: 数据智能团队 爱奇艺技术产品团队 01 背景 随着互联网公司的产品和业务越来越多样,利用数据来驱动业务决策成为必然, 而AB实验正是以数据指标来判断产品功能和运营策略迭代效果的方法和工具,其可以在保证样本同时性和同质性基础上,对比两个或多个实验组在同一应用场景下的效果。 以上边的实验为例……
阅读全文
2022年3月15日
作者 | 孙子荀(授权) 编辑 | 小智 随着云结合微服务架构切实的提高了生产效率;深度学习不断深入内容处理的各个领域促进生产力的发展。 在消息系统,数据仓库,计算框架,存储系统等基础架构层建设逐步提升的基础上,大型互联网公司进一步提出了业务基础设施的需求。在基础架构和上层业务之间急需一个中台……
阅读全文
2022年3月15日
作者: JayLou 娄杰 预训练模型(Pre-trained Models,PTMs) 的出现将 NLP 带入了一个全新时代。2020 年 3 月 18 日,邱锡鹏老师发表了关于 NLP 预训练模型的综述《Pre-trained Models for Natural Language Processing: A Survey》, 这是一篇全面的综述,系统地对 PTMs 进行了归纳分类。 本文以此篇综述论文为主要参考,通过借鉴不同的归……
阅读全文
2022年3月15日
作者 | 周博 文章来源 | 阿里巴巴中间件团队 在阿里淘宝 双11 的过程中,长期以来都是在生产环节做全链路压测的,通过实践我们发现在生产环境中做压测,实际上会和一个 IT 组织的结构、成熟度、流程等紧密相关,所以我们把全链路压测从简单的制作范围内脱离出来,变成整个业务连续性的方案。 本文分四个方面为……
阅读全文
2022年3月15日
桔妹导读: 每天滴滴都会为上千万人提供出行服务,在这一过程中积累了海量轨迹数据。这些轨迹数据来自于公共服务,本文介绍如何利用这些数据回馈大众,改善出行体验。 一 背景 首先简要介绍一下什么是数据挖掘。数据挖掘(Data Mining)是指从大量数据中发现特定信息和模式的过程,也有很多人将这……
阅读全文
2022年3月15日
原文发布于微信公众号 - 小小挖掘机(wAIsjwj) 原文发表时间:2018-11-19 知识图谱特征学习在推荐系统中的应用步骤大致有以下三种方式: 依次训练的方法主要有:Deep Knowledge-aware Network(DKN) 联合训练的方法主要有:Ripple Network 交替训练主要采用multi-task的思路,主要方法有:Multi-……
阅读全文
2022年3月15日
转载自 DataFunTalk 公众号 本文由DataFun社区根据饿了么研发总监马尧老师在2018AI先行者大会中分享的《外卖推荐算法中的市场机制和调控手段》编辑整理而成。 提到市场机制和调控手段,大家可能会想起某些中央机构,而在流量的分发方面,我们的角色是类似的,搜索推荐是饿了么的核心流量入口,我们通过……
阅读全文
2022年3月15日
作者: jackhan 微信AI 导 语 在如今搜索领域中,简单的关键词匹配已经无法胜任全量的query,如果能够识别出query的意图,对于返回类型多样性,提升相关资源占比以及关联相关结果更加有效。所以Query的意图识别尤为重要,在一些垂直领域中,query意图识别也演变为类目识别。借着近期工作内……
阅读全文