首页
个人开发
工作相关
搜索
登录
搜索
colo
欲买桂花同载酒
累计撰写
1823
篇文章
累计收到
0
条评论
首页
栏目
首页
个人开发
工作相关
实时计算
2025-12-12
设计实时交易风控系统:检测高频交易行为
实现要点:使用 Apache Flink 作为实时计算框架(低延迟、精确一次语义)采用 滑动窗口(如10秒窗口,5秒滑动)统计用户交易次数通过 Keyed State 存储用户交易计数和标记状态设置阈值(如5次/10秒)触发告警结合 Kafka 作为数据源和下沉
2025年-12月-12日
5 阅读
0 评论
实时计算
2025-12-12
实时计算中滑动窗口的应用
滑动窗口用于处理实时数据流中连续变化的子集。核心要点:定义:按固定时间间隔滑动的数据集合(如最近5分钟)作用:持续计算动态变化的数据(如每分钟的访问量)关键参数:窗口大小(5分钟)和滑动步长(1分钟)典型API:Flink的 timeWindow(Time.minutes(5), Time.minutes(1))
2025年-12月-12日
4 阅读
0 评论
实时计算
2025-12-12
广告点击实时TopN统计
实现实时广告点击TopN统计的核心要点:使用滑动窗口(如5分钟窗口,1分钟滑动)统计点击量通过水印机制处理延迟数据(允许2秒延迟)采用Keyed State存储广告点击计数器在窗口触发时使用优先队列计算TopN结合Checkpointing保证Exactly-Once语义
2025年-12月-12日
4 阅读
0 评论
实时计算
2025-12-12
高吞吐场景下的实时异常检测系统设计与优化
设计要点:采用滑动窗口结合Z-score算法实时计算指标偏离度使用Flink状态后端管理基线数据,通过TTL防止状态爆炸实现两级容错:Checkpoint保证状态一致性 + 死信队列处理极端异常优化策略:部分聚合减少shuffle数据量,事件时间处理解决乱序问题通过异步I/O和状态分区提升吞吐量
2025年-12月-12日
4 阅读
0 评论
实时计算
2025-12-12
设计实时统计最近1小时商品点击量的TopN系统
实现要点:使用滑动窗口(1小时窗口,5分钟滑动)统计点击量采用事件时间语义处理乱序数据,设置合理水位线通过Keyed State存储中间结果减少计算开销使用二次聚合优化TopN计算:先本地聚合再全局排序结果写入Redis/ZooKeeper供下游查询
2025年-12月-12日
2 阅读
0 评论
实时计算
2025-12-12
设计高吞吐低延迟的实时金融交易异常检测系统
设计要点:采用事件时间处理和滑动窗口统计交易频率使用Keyed State存储账户行为画像实现端到端精确一次语义保证通过水位线机制处理乱序数据设计分层告警策略减少误报采用异步检查点和状态分片优化性能
2025年-12月-12日
4 阅读
0 评论
实时计算
2025-12-11
设计滑动窗口实时统计用户点击量
实现一个实时统计最近5分钟用户点击次数的系统,需考虑:使用滑动窗口机制(如Tumbling Window + Session Window组合)采用事件时间语义处理乱序数据通过状态后端存储中间结果设计Watermark机制处理延迟数据实现检查点机制保证Exactly-Once语义
2025年-12月-11日
4 阅读
0 评论
实时计算