Flink系列- 第38讲:Flink 调用 CEP 实现报警功能

在上一课时中,我们详细讲解了 Flink CEP 中 Pattern 的分类,需要根据实际生产环境来选择单个模式、组合模式或者模式组。 在前面的课程中我们提到的三种典型场景下,分别根据业务需要实现了 Pattern 的定义,也可以根据自定义的 Pattern 检测到异常事件。那么接下来就需要根据检测到的异常事件发送告警,这一课将从这三种场景入手,……

阅读全文

Flink系列- 第37讲:自定义 Pattern 和报警规则

在上一课时提过,PatternStream 是 Flink CEP 对模式匹配后流的抽象和定义,它把 DataStream 和 Pattern 组合到一起,并且基于 PatternStream 提供了一系列的方法,比如 select、process 等。 Flink CEP 的核心在于模式匹配,对于不同模式匹配特性的支持,往往决定相应的 CEP 框架是否能够得到广泛应用。那么 Flink CEP 对模式提供了哪……

阅读全文

Flink系列-第36讲:自定义消息事件

我们在上一课时中讲了 CEP 的基本原理并且用官网的案例介绍了 CEP 的简单应用。在 Flink CEP 中存在多个比较晦涩的概念,如果你对于这些概念理解有困难,我们可以把:创建系列 Pattern,然后利用 NFACompiler 将 Pattern 进行拆分并且创建出 NFA,NFA 包含了 Pattern 中的各个状态和各个状态间转换的表达式。这整个过程我们可以把 Flink……

阅读全文

Flink系列-第35讲:项目背景和 Flink CEP 简介

从这一课时开始我们将进入“Flink CEP 实时预警系统”的学习,本课时先介绍项目的背景、架构设计。 背景 我们在第 11 课时“Flink CEP 复杂事件处理”已经介绍了 Flink CEP 的原理,它是 Flink 提供的复杂事件处理库,也是 Flink 提供的一个非常亮眼的功能,当然更是 Flink 中最难以理解的部分之一。 Complex Event Processing……

阅读全文

Flink系列-第34讲:Flink 和 Redi 整合以及 Redi Sink 实现

上一课时我们使用了 3 种方法进行了 PV 和 UV 的计算,分别是全窗口内存统计、使用分组和过期数据剔除、使用 BitMap / 布隆过滤器。到此为止我们已经讲了从数据清洗到水印、窗口设计,PV 和 UV 的计算,接下来需要把结果写入不同的目标库供前端查询使用。 下面我们分别讲解 Flink 和 Redis/MySQL/HBase 是如何整合实现 Flink Sink 的。 Flink Redis Sink 我们在……

阅读全文

Flink系列-第33讲:Flink 计算 PV、UV 代码实现

上一课时我们学习了 Flink 消费 Kafka 数据计算 PV 和 UV 的水印和窗口设计,并且定义了窗口计算的触发器,完成了计算 PV 和 UV 前的所有准备工作。 接下来就需要计算 PV 和 UV 了。在当前业务场景下,根据 userId 进行统计,PV 需要对 userId 进行统计,而 UV 则需要对 userId 进行去重统计。 下面我们使用不同的方法来统计 PV 和 UV。 单窗口内存统……

阅读全文

Flink系列-第32讲:Flink 和 Kafka 整合时间窗口设计

我们在第 31 课时中讲过,在计算 PV 和 UV 等指标前,用 Flink 将原始数据进行了清洗,清洗完毕的数据被发送到另外的 Kafka Topic 中,接下来我们只需要消费指定 Topic 的数据,然后就可以进行指标计算了。 Flink 消费 Kafka 数据反序列化 上一课时定义了用户的行为信息的 Java 对象,我们现在需要消费新的 Kafka Topic 信息,并且把序列化的消息转化为用……

阅读全文

Flink系列-第31讲:Kafka 模拟数据生成和发送

第 29 课时讲过,在计算 PV 和 UV 的过程中关键的一个步骤就是进行日志数据的清洗。实际上在其他业务,比如订单数据的统计中,我们也需要过滤掉一些“脏数据”。 所谓“脏数据”是指与我们定义的标准数据结构不一致,或者不需要的数据。因为在数据清洗 ETL 的过程中经常需要进行数据的反序列化解析和 Java 类的映射,……

阅读全文

Flink系列-第30讲:Flume 和 Kafka 整合和部署

Flume 概述 Flume 是 Hadoop 生态圈子中的一个重要组件,在上一课时中提过,它是一个分布式的、高可靠的、高可用的日志采集工具。 Flume 具有基于流式数据的简单灵活的架构,同时兼具高可靠性、高可用机制和故障转移机制。当我们使用 Flume 收集数据的速度超过下游的写入速度时,Flume 会自动做调整,使得数据的采集和推送能……

阅读全文

Flink系列-第29讲:项目背景和实时处理系统架构设计

从这一课时开始我们进入“Flink 实时统计 PV、UV”项目的学习。本课时先介绍实时统计项目的背景、架构设计和技术选型。 背景 PV(Page View,网站的浏览量)即页面的浏览次数,一般用来衡量网站用户访问的网页数量。我们可以简单地认为,一个用户每次打开一个页面便会记录一次 PV,也就……

阅读全文

最近文章

福利派送

分类

标签

360搜索 58同城 AB测试 AFM模型 AI AIGC AILab AI平台 AKF架构 ANN AOF AOP AQS ASR AUC AdaBoost AdaDeltaW AdamW AdvancedFeaturesOfNetty Airbnb Alink AnnotationFormatterFactory Announcement ApacheFlink AresDB Augur AutoML Automaton BERT BI BI平台 BPR Bagging Bandits BigGAN CNN CRF CTR CTR模型 CTR预估 CV CVPR ClickHouse ConcurrentProgramming Condition DDD DDD实战 DIN DKN模型 DMP平台 DPP DRN DSP DSSM DeepFFM DeepFM DeepFM模型 DesignPattern DevOps DevOps Dgraph Doris Druid Dubbo EE问题 ELK ELMo ESSM ETL Embedding EncodingSpecification Epoll FFM FFM模型 FM FM模型 FST FTRL Faraday Feed流 FixMatch FixedBitSet Flink FreeWheel FullGC GAN GBDT GBDT+LR融合 GBM GC GNN GRU4REC Git Google GraphScope Ha3 Hbase Hologres Hystrix IM IOTechnologyBase IRGAN IT博士 IT移民 Iceberg ImageNet Impala InnoDB IntBlockPool IoC JDBC JDK js JanusGraph java JavaScript KBQA KV存储 Kubernetes LDA LSTM LSTM网络 LambdaMART LearningExperience Linux LruCache Lucence MKR模型 MLflow MMoE MRR Milvus MoE Mock Monorepo mysql Mybatis NDCG NER NIO NIPS NLP Netty Netty主要组件源码分析 Netty多协议开发 Netty技术细节源码分析 Netty编解码 nextjs nextjs OCR OKR OPPO PageRank Parser PersonalExperience Pinot PlaceholderResolver Printer PropertySource Pulsar Push系统 Q&A Que2Search Query扩展 Query理解 R-Tree RMI ROC RPC RTree reactjs Redis RippleNet rocketmq SD SHAP SIGAI SPI SVM Sentinel Serverless SimCLR Softmax Spring Spring5新特性 SpringBoot SpringBootBatch SpringCloud SpringMVC SpringSecurity SpringTransaction Spring整体脉络 Spring源码故事(瞎编版) Stable Diffusion Stage TCP粘拆包 TFServing TX TensorFlow Tomcat Topk Transformer TurboSearch Typora UX WebRTC Wide&Deep Word2vec XDL XDeepFM XGBoost XLNet Yoo视频 YoshuaBengio ZeroSearch Zookeeper abtest android apache apollo architectureDesign basic boosting checkpoint clazz cluster collection concurrentCoding css cto docs elasticsearch flutter format game github gitlab go golang graphql hadoop java JDBC js kafka lab linUCB方法 lucene message mvc Mybatis mysql nacos nexp nextjs nifi node2vec nodejs npm olap one-hot oss python pytorch query纠错 react reactjs reactor Redis region registry remote rocketmq RPC scala select sharding skleam solr spark sqllit storm storybook tailwind trace vivo vuejs web web3 一致性 丑小鸭定理 业务 业务线 个性化推荐 个性化海报 中关村 中文分词 中文纠错 主题建模 书籍 事件驱动架构 事务 亚马逊 交叉验证 人工智能 人机问答 供应链 依存句法分析 信息检索 信息流推荐 倒排索引 倒排表 假设检验 全文索引 全民K歌 全链路压测 公平锁 关系 兴趣 内容挖掘 内容理解 决策树 冷启动 出轨 分层实验 分布式 分布式事务 分布式系统 分布式锁 分词 创业 加权融合 北京 区块 区块链 协同记忆网络 协同过滤 协方差 单元测试 博士 博士offer 压测 原则 双塔模型 反作弊 反欺诈 反脆弱 变量 召回 召回率 可观测性 可解释性 合约 后厂村 向量召回 向量检索 向量索引 吴恩达 命名实体识别 响应式编程 商汤科技 回归模型 因果分析 图像检索 图像识别 图数据库 图灵平台 图片翻译 图计算 在线学习 坐标回归 基于Netty开发服务端及客户端 基础支持层 增量学习 多多 多模态 多目标优化 大数据 大数据开发 头条 奥卡姆剃刀 学习 学习资料 学习资源 学会提问 实体识别 实时推荐 实时数仓 实时数据 实时日志收集 实时计算 实验平台 容灾体系建设 对比学习 对话系统 小城市 小米 小米搜索 小群效应 工作 布隆过滤器 帮帮 年轻人 广告 广告系统 序列标注 建模调参 开源数据集 开源项目 异常检测 异步IO 张嘉佳 强化学习 归一化 待分类 微服务 微软EXP 微软亚洲研究院 思维 性能优化 情感分析 意图识别 房租 技术 拆分 招聘 拼多多 持续交付 持续集成 损失函数 排序 排序模型 排队 推理系统 推荐 推荐理由 推荐系统 推送平台 提问的智慧 搜索 搜索广告 搜索引擎 搜索排序 搜索架构 搜索系统 支持向量 支持向量机 数仓体系 数仓平台 数据中台 数据仓库 数据分析 数据分析平台 数据同步 数据平台 数据指标 数据挖掘 数据治理 数据湖 数据科学 数据结构 数据集 数据驱动 文字识别 文摘 文本分类 文本情感分类 文本挖掘 文本纠错 文本表征 新闻推荐 方法论 日志架构 日志检索 时序特征挖掘 智慧物流 智能合约 智能客服 智能物流 智能语音 智能问答 智能预警 服务 机器学习 机器学习爱好者 机器学习面试题 机器翻译 机器视觉 机器阅读 条件随机场 架构 架构师 标签 标签平滑 标签识别 标签选择 校招 样本 核心处理层 检索引擎 槽位识别 模型剪枝 模型压缩 模型融合 模型评估 模型部署 模型预估 模式匹配 模式识别 正则化 注意力机制 洋码头 流批一体 消息队列 深度 深度兴趣网络 深度学习 深度树匹配 深度树检索 混排 混沌工程 火焰图 热点挖掘 熔断降级 爬虫 爱奇艺 牛顿-莱布尼茨 物流 特征工程 特征平台 特征系统 猜你喜欢 用户建模 用户画像 电商搜索 白兔 百度 相关系数 真话 矢量语义 知乎架构 知识图谱 知识增强 知识蒸馏 短文本解析 短视频 短语抽取 短语挖掘 碧桂园 神经网络 神马搜索 离线计算 秒杀架构 秒杀系统 程序人生 程序员 稳定性规范 空间索引 窗口函数 端上智能 端智能 算法 类协同训练 类目识别 粗排 索引 线程 线程池 缓存 网络图 置信度 美团 美团大脑 美团点评 职场 联邦学习 腾讯技术 腾讯音乐 自动化测试 自动驾驶 自然语言处理 色情识别 花椒直播 苞谷 蚂蚁金服 规则平台 规则引擎 视频推荐 计算广告 计算机视觉 认知 讨论区 记忆建模 记忆网络 论文 评价指标 评测指标 词向量 词嵌入 词权重 语义分割 语义匹配 语义检索 语义模型 语义理解 语言模型 语音内容识别 语音识别 谷歌面试 贝叶斯个性化排序 贝壳找房 贝壳智搜 货币化 起步 趋势科技 路径规划 软实力 边缘计算 达摩院 迁移学习 过拟合 逻辑回归 逻辑思维 采购 重叠实验框架 重排序 重构 金融 银汤匙 链表 链表求交集 阿里 阿里云 阿里妈妈 阿里小蜜 阿里达摩院 陈薇 陌陌 降纬打击 随机变量 零拷贝 面经 面试 项目管理 预估引擎 预训练 领域设计 领域驱动 风控 风控系统 高可用 高并发 高斯热图 高维数据索引 黄峥 黑盒模型

友情链接

其它