基于海量日志和时序数据的质量建设最佳实践-孙亚宁-阿里云(2021 QECon全球软件质量&效能大会上海站).pdf

想预览更多内容,点击预览全文

申明敬告:

本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己完全接受本站规则且自行承担所有风险,本站不退款、不进行额外附加服务;如果您已付费下载过本站文档,您可以点击这里二次下载

文档介绍

主办⽅: 基于海量⽇志和时序数据的 质量建设最佳实践 9 ⽉25-26 ⽇|上海 孙亚宁 阿⾥云,技术专家

嘉宾照⽚ 就职于阿⾥云⽇志服务SLS团队,对基于云原⽣架构下的产品,⾯向海量客户和数据系统 的DevOps、SRE与质量建设有多年实战经验。 曾就职于依图科技,负责基于AI服务器的⼤规模异构集群的运维平台架构、开发与设计。 1. 质量建设痛点 2. 数据统⼀接⼊和管理

⽬录 3. 智能巡检 Contents 4. 告警智能管理 5. 总结&展望

01 质量建设痛点 质量观测的完整⽣命周期 开发阶段 测试阶段 灰度验证 线上运⾏ 1 2 3 4

• 静态代码扫描 代码测试覆盖率 • 版本性能差异 • 线上性能指标

• 依赖检查 测试⽤例失败率 • 服务稳定性 • 应⽤⽇志

• 千⾏代码缺陷 • 链路追踪数据 率 • 线上巡检

• 严重缺陷率 质量建设痛点

海量异构数据 依赖规则,缺乏智能 告警⻛暴与告警误报

在系统开发、测试、验证、上线等各个阶段产 质量监控⽐较依赖⼈的经验,很⼤程度上受限于⼈ 完整的软件⽣命周期中可能产⽣⼤量告警,难

⽣⼤量的⽇志、时序、Trace等数据,快速精 为设定的规则和阈值,⽆法数据⾃适应,不能够真 以从中识别出有效信息;误告警产⽣“狼来了” 正发挥数据的价值

准地挖掘潜在问题⽐较困难 效应,导致真实存在的问题被忽略

02 数据统⼀接⼊和管理 海量数据管理痛点

运维成本⾼ 扩展困难

完整的质量系统需要数个甚⾄⼗ 随着数据规模的增⻓,软件的扩

多个软件协同,运维成本极⾼ 展能⼒、性能、稳定性等⽅⾯存 在着极⼤挑战 学习成本⾼ 数据孤岛

每个软件都有⾃⼰的使⽤界⾯、 不同的数据处于不同的系统中, 插件系统、DSL语法,学习成本 数据协同困难 ⾼、很难完全掌握

数据统⼀接⼊和管理 可视化与监控

开发阶段 测试阶段 灰度验证 线上运⾏

03 智

最近下载