2022年3月15日
版权声明 作者:李铁牛 本文为InfoQ原创投稿。 移动互联网广告基于大数据,实现广告的精准人群定向投放和效果评估,并借助于不可胜数的广告策略,控制着广告的实时投放,让数据驱动型的移动互联网广告沿着站方、用户、广告主三者共赢的目标不断前进。 大数据驱动使得效果指标的量化评估成为了可能。为……
阅读全文
2022年3月15日
分享嘉宾:观宙 阿里飞猪 算法专家 编辑整理:王吉东 出品平台:DataFunTalk 导读: 在飞猪搜索CPC广告业务中,广告策略不仅需要考虑CPC消耗和广告主ROI,平台整体营收 ( 即CPC消耗+自然交易抽佣 ) 也是不能忽略的优化目标。传统上基于广告pCTR、pCVR、bid等因子的策略算法……
阅读全文
2022年3月15日
作者 : 高沛, 2018年7月加入去哪儿网,目前负责酒店搜索、门票搜索、大搜等搜索相关业务,曾参与基于Lucene的搜索召回服务搭建,个人对搜索引擎、分布式技术比较感兴趣,喜欢探究技术内幕、深入了解底层原理。 1 前言 Lucene 作为 Apache 开源的一款搜索工具,一直以来是实现搜索功能的神兵利器,现今火热……
阅读全文
2022年3月15日
这里是[「王喆的机器学习笔记」]的第十九篇文章,这篇文章要谈的是 推荐系统的优化目标 的问题。作为一名算法工程师来讲,最关心的往往是模型的创新、技术的演进。笔者在最开始工作的几年,也经历过这样的阶段,执着的追求于应用最新的技术,追踪最新的paper,更新最新的机器学习工具。这样持续学……
阅读全文
2022年3月15日
第一小节 Lucene 常见查询的使用 从本篇文章开始介绍 Lucene 查询阶段的内容,由于 Lucene 提供了几十种不同方式的查询,但其核心的查询逻辑是一致的,该系列的文章通过 Query 的其中的一个子类 BooleanQuery,同时也是作者在实际业务中最常使用的,来介绍 Lucene 的查询原理。 查询方式 下文中先介绍几种常用的查询方式的简……
阅读全文
2022年3月15日
丁香园大数据 NLP 前言 最近,我司各条业务线对于搜索优化的需求日益增多,NLP 组也将对搜索业务给予更多的工作支持。后续分享,我们会关注过往的知识图谱、短本文理解等相关技术如何落地到搜索业务中。 影响搜索结果的因素有很多,包括对 短文本的正确理解(实体词识别、纠错、意图分析等)、 长文本良好结……
阅读全文
2022年3月15日
2020年的开局太不寻常,一场新冠疫情闹得大家都过不好年,这个春节假期对于我们来说可能是史上最长春节。除了待在家里不能出门外,对我们生活并没有其他的影响。但疫情对各大企业的影响可不是那么简单了。 因疫情原因,很多企业都延长了假期,同时也组织团队成员们开启了远程办公的模式。没办法,……
阅读全文
2022年3月15日
最近在做时间序列的项目,所以总结一下构造的特征的方法和一些经验。 先放上大纲: 1.时间特征 1.1 连续时间 持续时间: 浏览时长; 间隔时间: 购买/点击距今时长; 距离假期的前后时长(节假日前和节假日后可能会出现明显的数据波动); 1.2 离散时间 年、季度、季节、月、星期、日、时 等; 基本特征,如果用 Xgboost 模……
阅读全文
2022年3月15日
系列文章: 构造 IndexWriter 对象(五) 构造 IndexWriter 对象(四) 构造 IndexWriter 对象(三) 构造 IndexWriter 对象(二) 构造 IndexWriter 对象(一) 本文承接 构造 IndexWriter 对象(五),继续介绍调用 IndexWriter 的构造函数的流程。 调用 IndexWriter 的构造函数的流程图 图 1: 生成对象 BufferedUpdatesStream 图 2: 介绍该对象会涉及很多在 文档提交之 flush 系列文章中的知识点,故如果没有看过或者不熟悉 flush 流程的……
阅读全文
2022年3月15日
分享嘉宾:靳骏奇博士 阿里巴巴 算法专家 编辑整理:李春雷 出品平台:DataFunTalk 导读 : 随着经济数字化地快速发展,互联网广告在赋能商家营销、帮助消费者高效了解商品和服务、以及商业平台的变现等方面扮演着越来越重要的角色。互联网广告生态中,广告主通过付费在媒体上对目标用户进行营销信……
阅读全文