sdn控制器可以真正幫助運維工程師感知網絡,基於telemetry技術即時傳輸,按業務所需的數據採集點和基於硬體的精確時刻下的數據採集,真實呈現網絡狀態,從用戶體驗 ,應用真實的運行狀態感知網絡,對網絡進行多維度的運維。
sdn控制器數據處理流程:
1、訂閱數據(syslog取得設備日誌,snmp設備數據,telemetry性能數據);
2、採集(sdn訂閱數據後,有採集服務完成數據採集,用telemetry秒級採集);3、緩存/分發(海量數據上傳至sdn後,經過高吞吐訊息快取機制,分發到對應的ai服務進行分析);
4、ai運算(sdn控制器根據採集的原始資料多維度分析處理,結合ai機器學習演算法來進行業務問題分析);
5、儲存/顯示(資料分析完後,儲存到快速分散式資料儲存系統中,並完成功能展示。)
智慧維運解決方案支援有線無線網路故障辨識和根因分析,所以必須從有線無線設備取得相關kpi數據,透過telemetry上報剛sdn控制器,sdn控制器將這些大數據進行歸類,用ai演算法呈現整個網路品質和故障辨識。
再一個是根據裝置提供的數據,建立視覺化使用者體驗品質評估體系,基於接取體驗,漫遊體驗,吞吐體驗,網路可用性四大類指標的品質評估體系,直覺的呈現全網品質。
無線設備主要採集:ap的cpu,記憶體 使用率,線上用戶數,射頻頻道,幹擾,流量,使用者接受訊號強度,丟包率,時延抖動,dhcp,認證。
有線設備主要採集:cpu,記憶體利用率,介面收發包次數,廣播包數,丟包數。
交換器上的光鏈路的光功率,電壓,溫度。
sdn控制器基於協定回放,實現用戶接入問題的故障定位,以圖形化方式展現用戶接入每一個過程,協議回放實現用戶接入三個階段(關聯,認證,dhcp)全流程可視,統計各個協議交互階段的結果和耗時,實現問題的精準定位。
運維人員接到使用者回饋認證失敗訊息後,根據使用者mac資訊查找回話記錄,成功和失敗的情況一目了然,根據失敗記錄點,查看失敗詳細記錄。
運維總結四種問題:
1、連接類別的問題:關聯失敗,認證逾時,認證失敗認證慢,dhcp失敗,dhcp慢。
2.空口效能問題:弱訊號覆蓋,頻道幹擾,空口壅塞,非5g優先。
3.漫遊類:乒乓漫遊,漫遊異常4、設備類:設備離線,cpu和記憶體暫用高,供電故障。
ai維用到四種以下演算法:
1、高斯過程迴歸演算法:利用歷史資料來計算和評估下一個調優週期內的ap負載預測值。
2.神經網路演算法:利用歷史資料來計算評估下一個調優週期內的ap負載預測值。
3.聚類演算法:利用大數據計算和完善網路設備拓撲分組信息,使得完了拓撲更加精準。
4.隨機森林演算法:透過對歷史資料分析來辨識邊緣ap。
有線無線透過telemetry採集網路設備的丟包,流量,狀態,配置等信息,可以完成高性能,實時採集,通過ai算法對數據信息進行分析極呈現,結合emdi(增強型媒體傳輸質量指標,對音視頻業務監控,質量感知,保證音視頻業務用戶體驗)emdi協議對視頻每一幀進行監控協議。
telemetry透過push模式即時高速的向擷取器推送網路設備的效能資料指標,提升網路設備和網路利用率。採集精度可以達到亞秒和毫秒極。
sdn控制器中的telemetry(tcp協定)透過yang語言收集原始數據,使用protobuf編碼格式透過加密通道將原始資料透過grpc谷歌遠端調用協定送給sdn控制器,從而實現:原始資料擷取,資料模型,編碼類型,傳輸協定的融合。