2022年3月15日
作者: 浅梦的学习笔记 “ 实验室小师弟新鲜出炉的面经,分别投递了腾讯(WXG),美团,阿里(搜索推荐),微软,头条和华为并取得 offer。分享给各位同学,祝大家求职面试顺利!收获满意的 offer” 腾讯 WXG, 开发 上来两道智力题: 25 匹马,5 条赛道,无计时工具,比出前三名最少多少场比赛 牛……
阅读全文
2022年3月15日
微博现在日活达到了 2 亿,微博广告是微博最重要且稳定的收入来源,没有之一,所以微博广告系统的稳定性是我们广告运维所有工作中的重中之重。 作者: 孙燕 51CTO技术栈 微博广告的运维主要负责资产管理、服务稳定性维护、故障应急处理以及成本控制等多个责任。 微博广告运维发展经历了如下阶段: 从早期……
阅读全文
2022年3月15日
作者:Pavel Kord ík 编译:ronghuaiyang 英文原文: https://medium.com/recombee-blog/introduction-to-personalized-search-2b70eb5fa5ae 导读: 一般来说,搜索是非个性化的,不过如果和推荐系统组合起来,也会有意想不到的效果。 寻找正确的信息总是很困难的。在不久之前,文档还是存放在实际的物理仓库中,要找到相关的文档是非常困难的。 当文档可以通过在线存储库访问时……
阅读全文
2022年3月15日
作为2018年自然语言处理领域的新秀,BERT做到了过去几年NLP重大进展的集大成,一出场就技惊四座碾压竞争对手,刷新了11项NLP测试的最高纪录,甚至超越了人类的表现,相信会是未来NLP研究和工业应用最主流的语言模型之一。本文尝试由浅入深,为各位看客带来优雅的BERT解读。 NL……
阅读全文
2022年3月15日
请介绍几种常用的参数更新方法。 梯度下降:在一个方向上更新和调整模型的参数,来最小化损失函数。 随机梯度下降(Stochastic gradient descent,SGD)对每个训练样本进行参数更新,每次执行都进行一次更新,且执行速度更快。 为了避免SGD和标准梯度下降中存在的问题,一个改进方法为小批……
阅读全文
2022年3月15日
作者简介 大卫,携程资深算法工程师,关注计算广告和推荐系统。 发表于: 2020年 7月16日 一、用户画像 用户画像这一概念最早源于交互设计领域,由交互设计之父Alan Cooper提出。其指出用户画像是真实用户的虚拟代表,是建立在真实数据之上的目标用户模型。具体而言,在互联网用户分析领域,……
阅读全文
2022年3月15日
Datawhale学术 作者:太子长琴,Datawhale意向成员 如何在有限数据下训练出高效的深度学习模型?本文深入研究了 预训练的前世今生,并带领读者一起回顾 PTM取得的最新突破,与未来的研究方向(文末附90分钟解读视频)。 利用深度学习自动学习特征已经逐步取代了人工构建特征和统计方……
阅读全文
2022年3月15日
作者: \* 世恩、风引、调参 一个神经网络结构通常包含输入层、隐藏层、输出层。输入层是我们的 features (特征),输出层是我们的预测 (prediction)。神经网络的目的是拟合一个函数 f*:features -> prediction。在训练期间,通过减小 prediction 和实际 label 的差异的这种方式,来更改网络参数,……
阅读全文
2022年3月15日
系列文章: 构造 IndexWriter 对象(三) 构造 IndexWriter 对象(二) 构造 IndexWriter 对象(一) 本文承接 构造 IndexWriter 对象(三),继续介绍调用 IndexWriter 的构造函数的流程。 调用 IndexWriter 的构造函数的流程图 图 1: 根据不同的 OpenMode 执行对应的工作 在上一篇文章中,我们介绍了执行 CREATE 模式下的工作,故继续介绍执行 APPEND 模式下的工作。 执行 APPEND 模式下的工作的流程图 图 2:……
阅读全文
2022年3月15日
前言 秒杀大家都不陌生。自2011年首次出现以来,无论是双十一购物还是 12306 抢票,秒杀场景已随处可见。简单来说,秒杀就是在同一时刻大量请求争抢购买同一商品并完成交易的过程。 从架构视角来看,秒杀系统本质是一个高性能、高一致、高可用的三高系统。而打造并维护一个超大流量的秒杀系统需要进行哪些……
阅读全文