2022年3月14日
(本实验选用数据为真实电商脱敏数据,仅用于学习,请勿商用) 在上一期基于协同过滤的的推荐场景中,我们介绍了如何通过PAI快速搭建一个基于协同过滤方案的推荐系统,这一节会介绍一些如何基于推荐对象特征的推荐方法。 首先看下整个业务流程图,这是一个基于对象特征的推荐场景的通用流程: 首先把数……
阅读全文
2022年3月14日
分享嘉宾:陈杨 快手 编辑整理:Hoh Xil 内容来源:BigData NoSQL 12th Meetup 出品社区:DataFun 快手建设 HBase 差不多有2年时间,在公司里面有比较丰富的应用场景:如短视频的存储、IM、直播里评论 feed 流等场景。本次只分享其中的一个应用场景:快手 HBase 在千亿级用户特征数据分析中的应用与实践。为什么分享……
阅读全文
2022年3月14日
问题1:搜索旋转排序数组带重复值问题 该题为leetcode第81题,搜索先转排序数组II 对于数组中有重复元素的情况,二分查找时可能会有 a[l]=a[mid]=a[r],此时无法判断区间 [l,mid] 和区间 [mid+1,r] 哪个是有序的。 例如nums=[3,1,2,3,3,3,3],target=2,首次二分……
阅读全文
2022年3月14日
文章作者:马宇峰 阅文集团 编辑整理:Hoh Xil 内容来源:作者授权 出品社区:DataFun 本文来自对论文:Applying Deep Learning To Airbnb Search 的解读。 内容大纲: 效果概览 模型演进 失败尝试 特征工程 系统介绍 一、效果概览 分为离线和在线俩部分。其中,一个重要指标是 NDCG 标准化文档累计增益,NDCG = DCG/IDCG 。 二、模……
阅读全文
2022年3月14日
原创: 王概凯 ⼀个⽣命周期过程为什么可以做架构拆分︖架构拆分时需要有什么前提条件吗︖对于这些问题很多⼈比较迷茫。本⽂尝试描述作者对架构拆分原理的理解,不⼀定正确,请各位读者指正。 为什么可以进行架构拆分 先来看看⼀个主体⽣命周期的内部活动。这些⽣命周期活动都有⼀个很明确的特征:前⼀个活……
阅读全文
2022年3月14日
吴恩达老师斯坦福CS230深度学习课程资源进行开放了,大家都知道吴恩达老师最出名的是他在coursera的机器学习课程,可以说让很多刚开始接触ml的小白入门该领域。 我个人本身也是在大二下学期由于学校一个创新项目的需求,学习吴恩达老师网易云课堂的机器学习课程,也记得ML从那个时候真……
阅读全文
2022年3月14日
文章作者:纪志伟@网易严选 内容来源:严选技术团队 导读: 随着Bert的发布,预训练 ( pre-train ) 成为NLP领域最为热门的方向之一,大规模的无监督语料加上少量有标注的语料成为了NLP模型的标配。本文将介绍几种常见的语言模型的基本原理和使用方式,以及语言模型在网易严选NLP业务上的实践,包括分……
阅读全文
2022年3月14日
作者:林默 来源:花儿街参考(ID:zaraghost)经作者授权发布 01 在萧山的“碧桂园.前宸府”工地基坑塌陷前两周,192公里外的上海市,碧桂园红墅林刚刚塌陷过一次。 相较于那次塌陷,两周后路基塌陷出的那个巨大的坑里简直装满了幸运,因为上一次,发生在六层楼高。 红墅林在建的售楼处,六……
阅读全文
2022年3月14日
导读:迄今为止,关于搜索未来形态的探索从未停止。2021年,尝试搜索流式体验新形态时,我们发现,在热点场景下提供更多视频、热议、资讯等富媒体内容,会带来更高的搜索分发。但是由于当前搜索架构贴着搜索搭建,留给富媒体内容混排的时间和空间非常有限,强制插入混排队列对当前搜索系统侵入性太……
阅读全文
2022年3月14日
原文自: 大快搜索 公众号 自然语言处理的基础涉及到对词的表征。华盛顿大学计算机科学与工程教授 Noah Smith(史諾亞)近日在 arXiv 发布了一篇入门介绍论文,由浅入深通俗易懂地介绍了自然语言处理中对词的处理和表示方法。 摘要:这篇介绍论文的目的是讲述如何让计算机处理语言的故事。这是自然语言处理(N……
阅读全文