2022年3月15日
1、前言 本文讨论了京东搜索在实时流量数据分析方面,利用Apache Flink和Apache Doris进行的探索和实践。流式计算在近些年的热度与日俱增,从Google Dataflow论文的发表,到Apache Flink计算引擎逐渐站到舞台中央,再到Apache Druid等实时分析型……
阅读全文
2022年3月15日
导读 随着公司用户增长业务快速发展,陆续孵化出 部落、同镇、C 端会员、游戏等非常多的业务板块。与此同时产品及运营对实时数据需求逐渐增多,帮助他们更快的做出决策,更好的进行产品迭代,实时数仓的建设变得越发重要起来。本文主要介绍用户增长业务基于 Flink 构建实时数仓的实践之路。 实时数仓1.0介绍……
阅读全文
2022年3月15日
今天我们一起回顾一下 近3年来的所有主流深度学习CTR模型,也是我工作之余的知识总结,希望能帮大家梳理推荐系统、计算广告领域在深度学习方面的前沿进展。 随着微软的Deep Crossing,Google的Wide&Deep,以及FNN,PNN等一大批优秀的深度学习CTR预估模型……
阅读全文
2022年3月15日
出自 搜狐技术产品 公众号 一简介 在推荐系统的排序环节中,我们经常使用CTR(Click-Through Rate)预估的方式来构建排序模型。在业界的实际应用上,如何通过大规模数据提取出有效特征对用户行为建模、泛化一直是研究人员的工作方向,由于在推荐系统的实际应用中,数据通常非常稀疏,如……
阅读全文
2022年3月15日
原文地址: https://zhuanlan.zhihu.com/p/72607641 导读: 今天分享一下 facebook 新发的深度学习推荐系统的论文: Deep Learning Recommendation Model for Personalization and Recommendation Systems https://arxiv.org/pdf/1906.00091.pdf 这篇文章概述了当前推荐系统实现的主要思路,提出了一种通用的模型结构 DLRM,与其他常见的 paper 不同,该篇有着浓浓的工业界风格,不仅和其他模型进行效果对比,还讲述了常见的特征如何处理,内在思维逻辑如何,在……
阅读全文
2022年3月15日
简介: 本文由网易云音乐实时计算平台研发工程师岳猛分享,主要从以下四个部分将为大家介绍 Flink + Kafka 在网易云音乐的应用实战: 背景、Flink + Kafka 平台化设计、Kafka 在实时数仓中的应用、问题 & 改进。 简介:本文由网易云音乐实时计算平台研发工程师岳猛分享,主要从以下四个部分将为大家介绍 Flink + Kafka 在……
阅读全文
2022年3月15日
上篇文章 http://www.6aiq.com/article/1564413040138 详细介绍了Lucene索引表的实现,内容涉及关于Terms Index以及Term Dictionary的剖析。 此文将继续剖析Lucene倒排索引实现的另一部分核心内容: 倒排表(Postings)。Lucene的官方文档关于该部分内容的描述非常丰富,所以学习起来也相对轻松。……
阅读全文
2022年3月15日
原文地址: https://my.oschina.net/u/992559/blog/1819948 作者: moyiguke 前言 在消息处理过程中,除了Flink程序本身的逻辑(operator),我们还需要和外部系统进行交互,例如本地磁盘文件,HDFS,Kafka,Mysql等。虽然Flink本身支持Exactly-Once语义,但是对于完整的数据处理系统来说,最终呈现出来的语义和……
阅读全文
2022年3月15日
文章作者:杨镒铭 滴滴出行 高级算法工程师 内容来源:记录广告、推荐等方面的模型积累@知乎专栏 今年KDD上Airbnb发表的关于embedding的论文拿到best paper,技术实力可见一斑。今天要说的这篇要更新一些,是Airbnb将深度学习应用在搜索业务中的经验汇总,链接是 [1810.09591] Applying Deep Learning……
阅读全文
2022年3月15日
作者:美丽联合集团 算法工程师 琦琦 , 公众号关注:诗品算法 0、引言 大家还记得那篇增量学习实践相关的文章吗?很多小伙伴私信我,想要进一步了解流程和设计细节等。感谢大家的信任,我愿将这些干货无私分享。从这篇文章开始,我会将增量学习的设计细节陆续拆分成几篇技术文章分享给大家。美名其曰——增……
阅读全文