算法在海量实时数据场景中的异常检测与定位实践
分享简介
蚂蚁金服金融核心系统对稳定性和恢复能力有极高的要求,构建完备的自动事中检测和恢复能力具有重要意义,也是是业界一大热门话题。结合蚂蚁金服AIOps的实践经验,以单源时间序列异常检测、多源时间序列融合异常检测和业务故障定位为切入点,分享我们在构建自动异常检测和定位能力时遇到的关键问题及解决方案。
分享提纲
1、背景介绍 2、量级(单指标)异常检测算法&子模型融合 3、量级(多指标)异常检测算法 4、“事件&故障”关联算法
分享收益
目标:了解在蚂蚁金服中,技术风险异动检测与定位的实际问题和挑战,如何运用机器学习来解决这些问题。
成功点:人工智能在智能运维领域的应用实践
启示:从业务场景出发,让算法为场景买单
