十万级设备全自动化管理-王雄-腾讯(2021 QECon全球软件质量&效能大会上海站).pdf
- 优选文档个人认证 |
- 2021-10-20 发布|
- 3.03 MB|
- 35页
主办方: 9月25-26日|上海 王雄 腾讯TEG云架构平台部 技术专家
嘉宾照片 Amazon 深耕7年, AWS DevOps 部门 Tech Lead 1 大规模基础架构服务的背景 2 设备管理质量和效率的挑战
目录 3 设备管理标准化和自动化 Contents 4 效果与收益 5 借鉴意义和未来展望
01 背景 1 大规模基础架构服务的背景 照片 照片 照片
分布式存储服务 数据库系统服务 CDN/视频点播直播服务
标准存储、低频存储、智能分层存储、 关系型存储、文档型数据库、KV型数 视频点播、直播、雾计算。年增长
归档存储、深度归档存储 (持久性 据库、ElasticSearch 超大规模集群 100+ YoY
12个9)
对象存储服务
• 存储性能要求与价格多样;
•磁盘质量影响大;
• 数据安全要求性高;
• 规模增长快;
数据库系统服务
• 数据库服务多样;
•客户访问方式多样;
• 集群配置方式不同;
CDN视频直播点播服务
• 机型机房多样;
• 调度灵活;
02 要解决的问题 需要解决的问题 设备成本 设备效率 设备质量
周转效率、闲置机器 上下架、裁撤 坏盘、维修、过期
设备成本
•物理机器交付周期难以确定;
• 机型数量大,易闲置;
• 新机型机器引入成本高;
设备效率
• 机型丰富、机器检查流程不一、性能要求不一;
• 机器上下架适配不一、机器迁移流程不一;
• 机器维修、机器下线等需对业务无感;
• 设备管理流程失败、重试等常见;
• 设备调度迁移灵活性要求高;
• 设备与软件自动化联动;
设备质量
• CPU性能影响客户业务请求;
• 坏盘、掉盘影响客户数据安全;
• 内存跳变;
03 问题解决思路/原理 设备管理态势分析
设备管理团队相对统一 成本高、竞争压力大 流程时间成本高;
十万级机器设备管理 S T 缓冲池机器成本高;
管理团队相