思享家丨時勢造英雄,AIOps 搶占 C 位

原創 思科聯天下 思科聯天下 1週前

思享家

是一個介紹如何利用思科先進技術解決客戶難題的欄目。每期聚焦一個技術熱點或應用場景,邀請資深思科技術專家深入淺出地介紹,為讀者提供實用性強的建議。

上一期我們為您解讀企業數字化轉型之旅中什麼是企業拓撲?帶給大家一種全棧式、端到端、跨多 IT 領域的全視角看待企業 IT 系統的框架。

企業拓撲是全視角能力,亦是運維方法論的轉變,轉變的原動力來自於正處於加速數字化轉型之中的企業業務、應用和基礎架構。

我們拿什麼來積極擁抱這樣的變化呢?答案便是本系列文章的主角——AIOps。跟傳統多運維方式相比,為什麼只有 AIOps 才能實現企業拓撲、真正為數字化轉型全面賦能?您將在本文中找到答案。

企業 IT 運維,整體而言今天有幾大方式:完全手工 – 比如逐台設備配置維護
腳本方式 – 人工編寫可執行腳本,讓機器自動化執行
工具方式 – 特定技術目的的特定工具
平台方式 – 特定技術領域的專門平台,比如漏洞或風險監測
DevOps – 人們傾向於它在 Dev 側的價值、以及溝通合作的文化轉型
AIOps – Gartner 於 2016 年提出、2017 年規範該術語

運維領域普遍期待解決的領域包括:異常檢測、智能告警、事件關聯、根因分析、優化建議和預測性運維。

運維的內容,不僅要考慮傳統的網絡、服務器、存儲,還需要考慮新型的多雲環境,且需要向上打通應用性能、業務 KPI、客戶數字化體驗;在一些行業還需要在關鍵技術領域有所突破比如 SAP 領域;在地理位置上還需要端到端的全鏈路打通而不是僅局限在私有云或某朵公有云(應用系統)內部。

1.多雲多域

疫情至今,企業業務部署多雲化已是共識,形成新常態下的企業數字經濟;業務部署橫跨多私有云、不同的公有云,以滿足新常態下更加期待的消費者需求。

多域,則指的是企業 IT 運維對象的技術領域範疇,如圖四大層次,即業務、應用、基礎設施(私有云)、公有云;涉及基礎網絡、計算資源(行業又稱為工作負載,即物理服務器 baremetal、虛機 VM、容器等等)、應用與開發、數字化體驗(業務 KPI 和客戶數字化旅程)。

今天,敏捷開發、DevOps、微服務、雲原生和治理的普及,使得多雲多域的應用交付能力大大超過整體運維能力,企業 IT 團隊既需高效敏捷地運維現有業務,更需要加速賦能企業新創業務。

圖1: 企業拓撲全棧式視圖

2.複雜性持續增加

業務創新和交易量曾爆炸式增長,企業 IT 環境複雜度正在持續增加,給企業 IT 運維和安全管理,帶來極大的挑戰,這是眾多企業 IT 團隊的切身體會。

這種複雜性,體現在多雲多域的方方面面,客戶感受到的任何錯誤,可能發生在企業 IT 環境的任何地方、任何系統、甚至任一行應用代碼位置,給運維帶來巨大挑戰。越來越多企業開始意識到,企業 IT 建設及其運維,已然從配角成為企業生產力, 甚至開始對業界做出了比較好的技術經驗輸出。

可以認為,在多雲多域多變複雜的環境中,業務和應用也比任何時候更加複雜和不可預測,企業需要比以往更多的針對業務和應用的可觀察力。

圖2: 複雜應用構建 vs 極簡客戶體驗

3.海量且孤立的數據

如前述全棧式視圖,企業拓撲裡每一層的每一個系統每一天都在產生巨量的系統運維元數據,事件、度量、告警、報錯、日誌等等,整體上的量級都在億或幾十億級別。

元數據,是運維體系關鍵的數據來源。今天,絕大部分運維環境裡,這些系統元數據之間相互獨立毫無關聯,形成不了具備解釋能力的企業拓撲,不具備全棧視圖效應,更談不上智能運維和快速根因定位;

同時,即使單個運維工具具備了某些算法和智能,但因為系統的相對獨立性,導致對應的運維團隊之間嚴重缺乏整體協作,形成不了全棧式端到端的企業拓撲能力;與此同時,我們的客戶正在煎熬當中,客戶流失風險劇增。

圖3: 孤島式被動運維與監控

在業界,數字化技術呈指數級發展,AI 一詞早已不是新概念;在企業 IT 業務和運維領域的 AIOps 一詞,也早在六、七年前就已出現。可以看出,當今紛繁複雜的技術背景下,對於企業 IT 而言,AIOps 已然不僅僅是可選項,而是運營動態且複雜的企業 IT 環境之必選項!人們也不再談 AIOps 而色變,而是在企業拓撲的不同層次開始推進落地, 在數字化轉型賽道為企業加速。

在接下來的文章裡,我們將從行業探索、業界發展、對企業的價值回報等角度,與您分享思科 AIOps 技術架構和典型場景;尤其使用場景,大多來自客戶自身的 AIOps 實踐,供大家參考思科 AIOps 如何幫助企業實現數字化轉型、實現業務價值最大化。