曾几何时,开发与运维“相爱相杀”。而现在,随着「运维」战略的出现,开发与运维之间的界限已变得模糊,也正因如此,市场上新应用、新产品出现的速度越来越快、QA流程也越来越短,这正是自动化趋势带给我们的最大改观。
在这个依靠速度取胜的时代,自动化需求也变的更加紧迫。众多运维团队意识到:AIOps(智能运维)对于改善IT管理系统生态、提高运营生产力具有非常重要的意义。
随着混合和多云架构的普及,以及边缘和物联网设备的高速发展,越来越多的企业使用一些混合模式或云端基础架构进行项目开发。这导致了IT系统架构变得比以往更加复杂,IT团队必须适应并跟紧变化的步伐,并且保证应用与服务的可靠性。
对于运维人员而言,最可怕的不是出现故障,而是出现故障后却找不到原因。而身处运维团队中,如果将主要精力投入到基础设施的建设与运维上,则会拖慢整个团队的生产力与敏捷性。
如果说DevOps是以人力扩展技术,那么「AIOps」则强调以技术扩展技术。简单来讲,AIOps就是基于已有的运维数据,例如日志、监控信息、应用信息等,并通过机器学习的方式进一步解决自动化运维无法解决的问题,其目的是将IT人员从耗时又容易出错的流程中解放出来。
理想的AIOps平台需要具备以下能力:
1、具备全线的实时数据采集、算法分析以及跨系统追踪能力,高效整合IT数据,并实现故障原因的实时分析。
2、设定动态基线以捕获超出静态阈值的异常情况,实现多指标异常检测并消除误报以及冗余事件。
3、依据智能算法以及机器学习,预测潜在的故障风险,针对已经发生的故障事件能够及时提供解决方案。
凭借智能的AIOps运维平台,DevOps团队可以接入不同的业务、管理、监控系统的海量数据,通过智能算法进行快速分析,让原本需要几小时完成的任务在数秒内便可完成,甚至预测潜在的应用问题与设备故障。
自从2016年Gartner提出AIOps,仅仅几年的时间,AIOps就完成了从技术概念到市场化的转变,越来越多的企业开始利用AIOps提高运营效率并拓展业务空间。而在自动化探索道路上,戴尔科技也通过一系列数字化举措来推动自动化变革。
通过开展DevOps转型运动,戴尔科技的开发人员已经能够将70%到75%的工作时间应用在编写代码上,获得35%以上的生产力提升。现在,戴尔科技正在利用AIOps来加速DevOps团队速度并取得积极的业务成果。
「CloudIQ」是戴尔科技推出的AIOps主动监控和预测分析应用程序,功能涵盖了服务器、存储、数据保护、存储区域、网络、超融合和融合基础架构,能够帮助运维人员深入了解戴尔科技的基础架构,提高运维管理工作效率。