2022年3月15日
文章作者:王华呈 360 资深算法工程师 编辑整理:杨辉之 内容来源:爱奇艺技术沙龙 出品社区:DataFun 导读: 随着展示广告业务数据量的日益增长,360展示广告召回系统也随之也进行不断升级改进。本次介绍主要从召回系统演进的角度详细阐述工程实践中的算法应用、技术难点以及解决方案。主要分成三块……
阅读全文
2022年3月15日
本文介绍 GC 基础原理和理论,GC 调优方法思路和方法,基于 Hotspot jdk1.8,学习之后你将了解如何对生产系统出现的 GC 问题进行排查解决。 内容主要如下: GC 基础原理,涉及调优目标,GC 事件分类、JVM 内存分配策略、GC 日志分析等。 CMS 原理及调优。 G1 原理及调优。 GC 问题排查和解决思路。 GC 基础原理 GC 调……
阅读全文
2022年3月15日
导读:据Gartner调研,应用开发需求的市场增长至少超过IT交付能力的5倍,预计到2025年,70%的新应用开发将使用低代码技术。我们需要在需求迭代越来越高频、创新能力要求越来越高的背景下,探索如何通过技术手段为业务开发降本增效提质做出突破,更高效的实现产品创新。百度搜索中台支……
阅读全文
2022年3月15日
作者 | 贺科学(晨末) 来源 | 阿里巴巴中间件团队 一、背景 1. 从事物的本质说起 事物本质就是内部的主要矛盾次要矛盾的演变过程,同时该演变过程受外界环境其他事物的相互关联和相互影响。在普遍的情况下,一个事物的生命周期,是它的主要矛盾、次要矛盾被解决的过程体现。如何分析问题本质,我们已经在 《「……
阅读全文
2022年3月15日
作者丨陈家铭 学校丨中山大学硕士生 研究方向丨半监督深度图像分类 本文来源: PaperWeekly 协同训练 Co-training Co-training 是基于分歧的方法,其假设每个数据可以从不同的角度(view)进行分类,不同角度可以训练出不同的分类器,然后用这些从不同角度训练出来的分类器对无标签样本进行分类,再选出认为可信的无标签样本加入训练集……
阅读全文
2022年3月15日
赵健博,快手大数据架构团队的负责人 工作十年,跳槽三次,四份工作 毕业后加入百度 我是在北京邮电大学就读的本科,毕业后被保送到了中国科学院计算技术研究所,硕士期间主要从事的是计算机系统结构与操作系统的相关研究。上学时对 Linux Kernel 非常痴迷,也做些有意思的小项目,研究生毕业后,还想着继续做这块的……
阅读全文
2022年3月15日
多个数据要同时操作,如何保证数据的完整性,以及一致性? 答:事务,是常见的做法。 举个 栗子: 用户下了一个订单,需要修改余额表,订单表,流水表,于是会有类似的伪代码: start transaction; CURD table t_account; any Exception rollback; CURD table t_order; any Exception rollback; CURD table t_flow; any Exception rollback; commit; 如果对余额表,订单表,流水表的SQL操作全部成功,则全部提交 如果任何一个出现问……
阅读全文
2022年3月15日
编辑整理 梁尔舒 向量检索基本概念 向量从表现形式上就是一个一维数组。我们需要解决的问题是使用下面的公式度量距离寻找最相似的 K 个向量。 欧式距离: 两点间的真实距离,值越小,说明距离越近; 余弦距离:就是两个向量围成夹角的 cosine 值,cosine 值越大,越相似; 汉明距离:一般作用于二值化向量,二值……
阅读全文
2022年3月15日
来源: 58技术 丁斌 导读 本文主要介绍如何基于Levenshtein和Damerau Levenshtein自动机技术高效地解决在搜索引擎系统中相似字符串快速查找问题的技术原理和操作实践。文中创造性地提出一种Damerau Levenshtein自动机的有效构建算法,并创造性地给出了利用……
阅读全文
2022年3月15日
转载自 : 杉枫 量变引起质变,这个情况在分布式redis集群下发生的极其明显,当用redis集群规模很小、存取数据很小时,基本上不会遇到任何问题,但是当我们集群规模为数T,并且存在很多业务读写集群各种各样问题都会发生。 线上遇到过一个业务突然tp99飙升,并且性能持续变差,性能看着一点……
阅读全文