十万级设备全自动化管理-王雄-腾讯(2021 QECon全球软件质量&效能大会上海站).pdf

想预览更多内容,点击预览全文

申明敬告:

本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己完全接受本站规则且自行承担所有风险,本站不退款、不进行额外附加服务;如果您已付费下载过本站文档,您可以点击这里二次下载

文档介绍

主办方: 9月25-26日|上海 王雄 腾讯TEG云架构平台部 技术专家

嘉宾照片 Amazon 深耕7年, AWS DevOps 部门 Tech Lead 1 大规模基础架构服务的背景 2 设备管理质量和效率的挑战

目录 3 设备管理标准化和自动化 Contents 4 效果与收益 5 借鉴意义和未来展望

01 背景 1 大规模基础架构服务的背景 照片 照片 照片

分布式存储服务 数据库系统服务 CDN/视频点播直播服务

标准存储、低频存储、智能分层存储、 关系型存储、文档型数据库、KV型数 视频点播、直播、雾计算。年增长

归档存储、深度归档存储 (持久性 据库、ElasticSearch 超大规模集群 100+ YoY

12个9)

对象存储服务

• 存储性能要求与价格多样;

•磁盘质量影响大;

• 数据安全要求性高;

• 规模增长快;

数据库系统服务

• 数据库服务多样;

•客户访问方式多样;

• 集群配置方式不同;

CDN视频直播点播服务

• 机型机房多样;

• 调度灵活;

02 要解决的问题 需要解决的问题 设备成本 设备效率 设备质量

周转效率、闲置机器 上下架、裁撤 坏盘、维修、过期

设备成本

•物理机器交付周期难以确定;

• 机型数量大,易闲置;

• 新机型机器引入成本高;

设备效率

• 机型丰富、机器检查流程不一、性能要求不一;

• 机器上下架适配不一、机器迁移流程不一;

• 机器维修、机器下线等需对业务无感;

• 设备管理流程失败、重试等常见;

• 设备调度迁移灵活性要求高;

• 设备与软件自动化联动;

设备质量

• CPU性能影响客户业务请求;

• 坏盘、掉盘影响客户数据安全;

• 内存跳变;

03 问题解决思路/原理 设备管理态势分析

设备管理团队相对统一 成本高、竞争压力大 流程时间成本高;

十万级机器设备管理 S T 缓冲池机器成本高;

管理团队相

最近下载