你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

卓越运营成熟度模型

卓越运营之旅是持续改进之一,每个阶段都建立在最后一个阶段之上,以推动工作负载设计、实施和支持的更高效和有效性。

其核心是简化部署、监视、测试和自动化等关键做法。 旅程以强大的基础开始:共享词汇、标准化做法和鼓励协作和稳定性的 DevOps 思维模式。 从那里,标准化为流程引入了一致性和可预测性。 随着团队越来越熟练,各个任务演变成集成的工作流,由生产就绪的功能(如自动化测试、智能监视和持续集成)提供支持。

当系统投入生产时,运营会变得更加高级。 团队能够快速可靠地管理更改,满足质量基准,并自信地实施来自产品所有者的功能请求。

最成熟的阶段是关于优化和创新。 在这里,团队大规模运营,实时调整系统,以满足不断变化的业务需求和技术转变。 但是,这不是固定目标;这是一种动态的心态,总是改进,总是适应。

该模型分为五个不同的成熟度级别,每个级别都有一个主要目标和一组核心策略。 使用下面的选项卡式视图浏览每个级别。 在推进过程中,也要回顾关键的权衡和相关风险。

目标图标强调在解决问题方面的团队合作和团结,以建立一个坚实的基础,在后续阶段创建一致的稳定作。

在级别 1 建立 DevOps 思维模式,确保未来策略的成功。 实施完善的 DevOps 方法以提高流程效率。 专注于构建基本和常见的词汇、流程和工具,以确保运营稳定。

关键策略

• 鼓励协作,培养无罪的文化

在培养协作文化的同时,使团队努力与业务需求保持一致。

集中团队成员、专职员工、合作伙伴或供应商通常负责工作负载运营。 这些人应作为集体力量,相互尊重和承认对方的专业知识。 如果团队作为独立部件运行,可能会发生复杂性和摩擦。 独立团队破坏了作为推动业务成果的单一高效系统运作的目标。

为了减少孤立的所有权感,倡导统一解决问题的方法。 所有努力都应满足业务需求。 将成功和失败视为共享结果。

• 采用标准协作方法和工具

从行业证明的工具和软件开发生命周期(SDLC)流程开始,这些流程适合工作负荷并提高开发效率。 不要偏离经过验证的方法,避免使用自定义方法,因为它们通常会带来更高的摩擦。

热门选择包括敏捷开发、Scrum框架和看板管理工具。 大多数经验丰富的开发人员、DevOps 工程师和产品所有者都熟悉这些工具,从而最大限度地减少新员工学习曲线。

最初,使用既定的行业标准来整合标准化。 稍后优化进程。 确保选择的工具可以随需求而增长,而无需提前切换到尖端解决方案。

• 设置源代码管理进程

根据应用程序的规模,决定如何构建源代码。 对于较大的系统,每个团队都应有自己的流程来生成和部署他们负责的组件。 它们应明确定义接口,允许组件可发现性并与系统的其他部分共享。 选择源代码管理技术并设置流程,以确保团队成员不会相互干扰工作。

同样,单个部署管道对于较小的应用程序可能更有效。 这简化了协调,也可能更适合可靠性。 但是,更新或迁移系统的特定部分可能很困难。

• 使用基础结构即代码(IaC)作为主要部署方法

使用声明性方法作为部署的标准,以确保一致性、可重复性和长期优势,例如自动化、自我文档和更改历史记录。

首选 IaC 部署而不是门户部署,以避免出现不一致的配置和缺少测试的风险。 避免使用仅限于特定程序编译的语言或专有格式。

首先,使用 Azure 原生支持的工具(如 BicepTerraform)来构建良好的基础。 评估工具以确保它们简化未来的旅程。 确保技术提供商有良好的文档和可靠的服务支持计划。

风险: 将错过的现代化机会视为风险。 例如,应使在本地解决方案中使用的工具和流程现代化。 迁移到云时,这些工具通常需要难以管理的自定义脚本,如果不对其进行现代化,可能会导致问题。

若要缓解此风险,请探索新式技术选项并更新本地进程。

采用 IaC 的目标之一是一致性。 使模板足够灵活,可以跨各种环境进行部署。 使用参数、变量和配置文件修改每个环境的资源设置。 仅提取必要的设置,并避免对很少更改的设置过度抽象。 此外,通过依赖广泛的模板库避免过度复杂化解决方案。 这种做法可能会导致维护挑战。

建立坚实的 IaC 基础,为将来的水平部署和系统管理优化创造更多机会。 例如,可以添加所需的状态配置或 GitOps。

• 从一开始就确定安全性的优先级

即使在此早期阶段,也优先考虑安全性。 安全措施通常基于分段,例如角色、资源和网络,这带来了复杂性。 团队必须承认这些复杂性,尽早制定安全措施,并计划随着时间的推移投资安全。 此方法可避免将安全实现推迟到后续阶段。

风险: 开发、支持和运营流程可能会产生摩擦。 尽管团队以良好的意图开始强大,但安全努力往往面临阻力。

若要降低风险,请将安全任务添加到积压工作。 这种做法可确保团队内部的责任明确,并使进度与开发任务一同被跟踪。

使工具和流程透明,以便通过审核和对等评审轻松检测漏洞。 探索支持漏洞扫描和安全控件的行业标准工具,即使尚未完全实现它们。

确保工具和部署做法使用与生产环境相同的标识提供者来最大程度地减少不同的标识控制平面。

后续步骤