6月30日,2023CCF国际AIOps挑战赛宣讲会暨AIOps研讨会在中国建设银行稻香湖数据中心圆满举办,来自工信部信息技术发展司、中国计算机学会、清华大学、中国建设银行、中科院、广通优云等30余家产学研代表莅临现场,广通优云副总裁兼首席技术专家 朱凤涛 发表了《运维数字化转型:生态运营和场景开发的底座构建》主题分享,与会嘉宾共同探讨了运维发展新趋势,共话数字化转型之道。
据悉,本届CCF国际AIOps挑战赛将首次采用开放式赛题。基于建行云“龙舟运维平台”的稳定性工具和多维监控系统,包括链路监控、应用监控、基础监控等,同时模拟大型生活服务APP的真实环境,提供端到端全链路监控数据及日志,揭示企业运维团队面对规模庞大、结构复杂、动态变化的运维数据需要解决的一系列挑战。
关于“龙舟运维平台” “龙舟运维平台”是广通优云和建行云合作打造的生态化运维平台。双方已合作多年,采用“搭平台,做场景”新模式,对建行原有传统IT运维系统进行了平台化模式的升级。同时,基于该数字化运维平台,为运维生态圈中其他组织的个性化运维场景提供服务接口和二次开发能力,目前已联动10余家合作厂商围绕安全管控、高效交付、快速响应、标准运营等构建了近百个运维场景应用,共筑运维生态圈,开创了Eco-Ops新型生态化运维模式,以此稳健支撑建设银行3大数据中心、50多个分支机构的一体化管理和业务持续发展,形成国内金融行业数据中心运维数字化转型的典型范式。 |
---|
“数字化转型是智能化场景构建的基础。”对于迈入数智化浪潮的每一家企业而言,要想构建丰富的智能场景,那便离不开数字化转型的落地。那么,随着企业整体数字化的深入,为各行各业带来了各式挑战,随着规模不断扩大的IT系统、日益复杂的系统架构、海量的IT运维数据,企业对于IT系统的连续性、稳定性的要求也进一步提高,而作为企业数字化转型坚实支撑的IT运维侧的数字化升级路线又会是怎么样的?广通优云副总裁兼首席技术专家朱凤涛将从运维数字化转型发展理念、技术工具和场景价值输出三个纬度给出答案。
* 本文根据其演讲实录整理而成,有删改。
回顾运维的数字化历程可以发现,以往运维的信息化建设往往都是按业务需求发展来不断构建运维工具,当需要进行决策时却发现竖井化、碎片化的工具无法带来支撑依据,除此之外
知识孤岛化、数据非标准等问题也常常出现。“运维本身是一门实践的科学。”朱凤涛表示,在不断地实践过程中,广通优云率先在业内提出平台化运维的理念,在技术层面,由工具向平台转型;在功能层面,由功能实现向价值凸显转型;在运维模式层面,由IT运维向IT运营转型;在合作模式层面,由竞合关系向生态共创转型,从而在整体上实现运维的数字化转型。
在Gartner所提出的平台运维工程中,上述平台化路径亦被清晰验证和规范,面向当前云上云下异构环境和技术架构持续演进的背景,涵盖了运维需求调研、架构设计到落地实施及售后服务的全流程阶段,对平台运维提出了支撑IT架构持续演进和管理、促进运维&安全能力开放和生态共创、提升研运一体生产力和从运维走向运营的要求。
“我们和建设银行一同共创的生态模型OASIS与Gartner所提出的要求不谋而合,通过将各类运维所涉及的对象要素抽象提炼模型化,封装统一的服务接口以服务目录的形式提供运维活动,基于此构建丰富的海量运维场景,实现运维生产实践的创新和输出,打造运维生态体系。”朱凤涛介绍,基于OASIS模型的生态化运维模式可以从根本解决运维最核心的难点——即如何应对不同的场景变化,实现自身价值的同时也给客户、合作伙伴传递价值。
理念的成功往往离不开技术手段的落地,在技术层面,我们基于金融大行的生产实践,构建了稳定可靠、自主可控的平台运维架构。通过将运维复用的共性组件下沉平台,构建软件定义、API 驱动的模块化平台架构,以平台底座+场景APP为支撑核心向上输出场景,并基于场景提供真正的价值,实现共享、复用、搭积木、组合式的场景化创新。其中,运维支撑平台应当囊括4大核心能力:
1、行业级的多中心、集约化支持能力:运维平台自身需要具备一定SaaS运营的能力,在满足现有企业级用户私有化部署的情况下,融合实现总部集约化运营、分支机构或客户远程接入的SaaS服务运营模式,给自身及客户带来价值的同时,也能实现知识的传导,是生态化运维模式延伸的价值。
2、大规模、可扩展的统一采控能力:面向当前云上云下、云原生等异构的资源分布情况和两地三中心、多活等复杂的数据中心架构,当前的运维采控从技术实现到对性能、架构的要求都截然不同于以往,在落地实践时既要兼顾资源的多样性,又要兼顾采控复杂度,同时还需要具备能够实现高扩展和高性能的支撑能力。
3、以CMDB为核心的运维数据治理能力:不同于传统的CMDB,运维平台所构建的CMDB应当作为“运维主数据”,如何进行治理才是CMDB建设的重点。而数据的治理往往需要实践经验的沉淀,优云的运维平台是经过建设银行、农业银行、交通银行、邮储银行等金融头部客户验证的成功经验,所搭建的以CMDB为核心的运维数据治理能够高效管理供数、精准实现数据消费,可靠进行数据治理,让运维数据真正能够为业务决策提供支撑。
4、以服务开放治理为核心的SRE能力:基于平台侧流程及自动化一体融合的闭环化服务,同时将平台侧的其他业务能力进行服务化封装,实现运维能力的输出和赋能,从运维应用的生命周期考虑,包含开发态到运行态两大类共享服务的支撑,助力数据中心运维应用开发的DevOps/SRE模式转型。
谈及运维生态价值的输出,朱凤涛向与会嘉宾介绍了广通优云与国内某大行共创的运维场景生态,该大行专门成立了SRE团队,和各合作伙伴一起基于数字化运维平台进行场景应用共创,既有开发周期在2-3周的轻量级应用,也有功能较丰富,开发周期3个月以上的专业级场景应用,高效支撑行内各处室运维管理工作。
“面向不同业务复杂度的场景,可提供复杂程度相匹配的运维开发模式,从而实现运维场景生态化的输出。“朱凤涛提到,面对运维场景非单一、复杂度参差等特性,可通过3种不同的开发方式来实现:
1、针对轻量级运维场景:可以采用低代码方式,通过融合平台各能力服务项,可无需编码或通过少量代码快速生成,极大的缩短应用交付周期;
2、针对典型复杂运维场景:可基于前端脚手架、Java和Python技术脚手架等,利用平台提供的服务API,按照开发资源包、指导文档、开发规范、管理工具和集成开发环境资源快速生成应用;
3、针对复杂度适中运维场景:随着运维数据中心数字化转型,运维场景的交付诉求的增多,场景开发会走向以低代码开发为主,代码开发增强扩展的方式进行混合开发,两者优势互补。
“最后,企业级的生态运维开发还需要满足运维开发流水线的监管要求。通过搭建开发流水线,串联开发、测试、上线、监控、反馈等应用研发各个环节,提供持续开发和集成的能力,打通应用的全生命周期流水线。”朱凤涛补充道。
基于前沿的运维数字化转型理念,夯实运维数字化转型底座平台能力,通过生态化开发建设的模式,UYUN优云已经携手100+行业高端用户,从平台化运维走向生态化运维,随着全球 IT 生态格局的演变,数字化转型,必然愈发成为个人及企业需要面对的课题,UYUN优云期待与更多客户一起,打造开放、共创、兼容、互利的生态化运维体系。