-
AI智慧運維總結
sdn控制器可以真正幫助運維工程師感知網絡,基於telemetry技術即時傳輸,按業務所需的數據採集點和基於硬體的精確時刻下的數據採集,真實呈現網絡狀態,從用戶體驗 ,應用真實的運行狀態感知網絡,對網絡進行多維度的運維。sdn控制器數據處理流程:1、訂閱數據(syslog取得設備日誌,snmp設備數據,telemetry性能數據);2、採集(sdn訂閱數據後,有採集服務完成數據採集,用telemetry秒級採集);3、緩存/分發(海量數據上傳至sdn後,經過高吞吐訊息快取機制,分發到對應的ai服務進行分析);4、ai運算(sdn控制器根據採集的原始資料多維度分析處理,結合ai機器學習演算法來進行業務問題分析);5、儲存/顯示(資料分析完後,儲存到快速分散式資料儲存系統中,並完成功能展示。)智慧維運解決方案支援有線無線網路故障辨識和根因分析,所以必須從有線無線設備取得相關kpi數據,透過telemetry上報剛sdn控制器,sdn控制器將這些大數據進行歸類,用ai演算法呈現整個網路品質和故障辨識。再一個是根據裝置提供的數據,建立視覺化使用者體驗品質評估體系,基於接取體驗,漫遊體驗,吞吐體驗,網路可用性四大類指標的品質評估體系,直覺的呈現全網品質。無線設備主要採集:ap的cpu,記憶體 使用率,線上用戶數,射頻頻道,幹擾,流量,使用者接受訊號強度,丟包率,時延抖動,dhcp,認證。有線設備主要採集:cpu,記憶體利用率,介面收發包次數,廣播包數,丟包數。交換器上的光鏈路的光功率,電壓,溫度。 sdn控制器基於協定回放,實現用戶接入問題的故障定位,以圖形化方式展現用戶接入每一個過程,協議回放實現用戶接入三個階段(關聯,認證,dhcp)全流程可視,統計各個協議交互階段的結果和耗時,實現問題的精準定位。運維人員接到使用者回饋認證失敗訊息後,根據使用者mac資訊查找回話記錄,成功和失敗的情況一目了然,根據失敗記錄點,查看失敗詳細記錄。運維總結四種問題:1、連接類別的問題:關聯失敗,認證逾時,認證失敗認證慢,dhcp失敗,dhcp慢。 2.空口效能問題:弱訊號覆蓋,頻道幹擾,空口壅塞,非5g優先。 3.漫遊類:乒乓漫遊,漫遊異常4、設備類:設備離線,cpu和記憶體暫用高,供電故障。ai維用到四種以下演算法:1、高斯過程迴歸演算法:利用歷史資料來計算和評估下一個調優週期內的ap負載預測值。 2.神經網路演算法:利用歷史資料來計算評估下一個調優週期內的ap負載預測值。 3.聚類演算法:利用大數據計算和完善網路設備拓撲分組信息,使得完了拓撲更加精準。 4.隨機森林演算法:透過對歷史資料分析來辨識邊緣ap。有線無線透過telemetry採集網路設備的丟包,流量,狀態,配置等信息,可以完成高性能,實時採集,通過ai算法對數據信息進行分析極呈現,結合emdi(增強型媒體傳輸質量指標,對音視頻業務監控,質量感知,保證音視頻業務用戶體驗)emdi協議對視頻每一幀進行監控協議。 telemetry透過push模式即時高速的向擷取器推送網路設備的效能資料指標,提升網路設備和網路利用率。採集精度可以達到亞秒和毫秒極。 sdn控制器中的telemetry(tcp協定)透過yang語言收集原始數據,使用protobuf編碼格式透過加密通道將原始資料透過grpc谷歌遠端調用協定送給sdn控制器,從而實現:原始資料擷取,資料模型,編碼類型,傳輸協定的融合。
-
Cisco實施企業進階路由與服務認證考試:300-410 ENARSI
Implementing Cisco Enterprise Advanced Routing and Services:300-410 ENARSI ExamCisco實施企業進階路由與服務認證考試:300-410 ENARSI300-410ENARSI考試詳情價格: 300 美元,或可使用Cisco 學習積分兌換。考試時間: 90 分鐘。語言:英語、日語。結果:考試結果(通過/未通過)通常會在 48 小時內在線公佈。重新認證:此考試可用於滿足重新認證要求。題型:考試題型多樣,包括情境題、選擇題和拖放題。所屬認證:思科認證網路專家 (CCNP) 企業版思科認證專家 – 企業高階基礎架構實施概述:通過300-410認證考試,您將獲得思科認證專家 – 企業高階基礎架構實施 (CCSPI) 證書,該證書也可用於滿足思科認證網路專家 (CCNP) 企業級認證的專業方向考試要求。此外,通過此考試還有助於您實現再認證目標。 實施 Cisco 企業進階路由和服務 (300-410 ENARSI) v1.1 是一項 90 分鐘的考試,旨在認證考生在實施和故障排除高級路由技術和服務(包括第 3 層、虛擬專用網路 (VPN) 服務、基礎設施安全、基礎設施服務和基礎設施自動化)方面的知識。 ENARSI 300-410 考試主題與學習指南使用官方考試主題準備 Cisco 企業進階路由與服務實施 (300-410 ENARSI) v1.1 考試。這份必備資源概述了您通過 Cisco 認證網路專家 (CCNP) 企業方向考試所需的一切知識,是您準備好旅程的理想學習指南。 該如何使用ENARSI考試主題?利用這些主題可以:確保您的 CCNP…
-
Token是什麼(AI時代的必知概念)
原創 小小戒網 Token是什麼,Token已經成為一種新的基礎的經濟要素和戰略資源。寫在最開始 AI浪潮奔湧,應用層出不窮,版本迭代日新月異。已經沒有人會懷疑「AI將深入我們每個人的生活」這句話的正確性了。但在所有關於AI的討論中,你一定常聽到一個字—「Token」。那麼, Token到底是什麼? 在電腦和互聯網技術中,Token是一個非常核心的概念。要講清楚Token,我們必須知道Token的三個不同的應用場景: 1.身份驗證中的Token(又稱為訪問令牌) 2.大語言模型(LLM)中的Token(以純文字語言模型為例進行講解,此時Token為文本單位) 【這一應用場景是今天講的重點】 3.區塊鏈與加密貨幣中的Token(代幣) Token應用程式場景一 我們先來看第一個應用程式場景:身份驗證中的Token(又叫做存取權杖) 這是我們日常上網最常遇到的。當我們登入一個網站或App 後,伺服器會發給你一個Token 例如: eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJ1c2VySWQiOjEsIm5hbWUiOiJKb2huIER vZSIsImV4cCI6MTcxNjI3MjAwMH0.SflKxwRJSMeKKF2QT4fwpMeJf36POk6yJV_adQssw5c 當然你也可能看到更短的Token ,顯然我給的這個Token比較長。雖然Token有業界通用的格式範式,但是,身份驗證中的存取權杖(Access Token)沒有統一「固定外觀」的。我們不用糾結Token的外觀格式是否統一,就簡單的理解成一串字母符號的構成。 其工作原理為如下: 1. 你輸入帳號密碼登入 2. 伺服器驗證通過,產生一個加密字串(即Token)發給你的瀏覽器或App。 3. 此後你每次要求資料(例如刷新朋友圈),都會自動帶上這個Token。 4. 伺服器看到Token,就知道“哦,這是張三,他已經登入了”,而不需要你每次操作都重新輸密碼。 …
-
Wi-Fi 7部署10大最常見的坑
來源:公眾號【網路科技乾貨圈】作者:圈圈ID:wljsghq2024年Wi-Fi 7正式商用,2026年已進入大規模部署階段:理論峰值46Gbps、320MHz超寬頻道、4096-QAM調變、MLO多鏈路操作、16空間流…這些黑科技聽起來誘人,但現實中90%的企業部署後,實際吞吐只發揮了30%-50%,高密度場景頻繁出現或隱升。坑1:缺乏專業站點勘測,直接「拍腦袋」部署AP很多團隊直接根據樓層平面圖每隔10公尺放一個AP,結果Wi-Fi 7的6GHz訊號穿牆能力極差(比5GHz弱30%-50%),導致會議室盲區或倉庫重疊幹擾。 Wi-Fi 7支援320MHz連續頻道,但實際環境中牆體、家具、金屬設備會造成嚴重衰減。 Wi-Fi 7引進前導碼打孔(Preamble Puncturing)技術,能跳過被佔用的20MHz子頻道,但前提是RF環境清晰。無熱圖分析,就無法計算RSSI、SNR和乾擾源。高密度區實際速率掉到Wi-Fi 6水平,客戶端頻繁切換頻段,MLO優勢蕩然無存。必須做專業站點勘測(Site Survey),使用Ekahau或NetSpot工具產生熱圖,考慮建築材料、使用者密度、IoT設備幹擾。建議AP間距依6GHz覆蓋半徑(室內約15-25公尺)進行調整。新加坡企業尤其要注意6GHz LPI功率限制(最大200mW)。我推薦先小範圍試點,再全網 rollout。坑2:低估PoE供電需求,AP「餓肚子」運轉Wi-Fi 7 AP滿血運轉(三頻+16流+MLO+IoT掃描射頻)功耗輕鬆超過30W,甚至達到50-60W。許多舊交換器還是802.3at(PoE+,最大30W),導致AP自動降級:6GHz射頻關閉、MLO停用、僅剩雙頻低功率模式。 Cisco Catalyst 917x系列、Aruba AP-735等旗艦款要求802.3bt(PoE++ Class 6,60W)。低功率模式下,4096-QAM和320MHz頻道無法啟用,實際速率腰斬。花大錢買Wi-Fi 7設備,卻只能跑Wi-Fi 6效能,投資打水漂。升級交換器到支援802.3bt的型號(如NETGEAR M4350系列),或使用PoE++注入器。部署前查AP資料表,開啟Intelligent Power Monitoring(IPM)功能自動最佳化。預算緊張可分階段:先用802.3at低功率運行,再升級。坑3:有線基礎設施沒升級,無線再快也白搭Wi-Fi 7單AP峰值可達10Gbps+,但如果上行還是1Gbps交換器+Cat5e線纜,後端直接瓶頸。許多企業只換AP不換線,造成「無線千兆,有線百兆」的尷尬。 Wi-Fi 7 AP普遍帶2.5G/5G/10G多GE口,要求Cat6A(支援10Gbps 100公尺)或光纖。舊Cat5e只能跑到1Gbps。高密度場景(如會議中心)總吞吐被有線拖累,MLO聚合頻寬無法發揮。與無線同步做有線升級,核心交換器至少10G上行,接取層2.5G/5G PoE++。新加坡企業可利用現有光纖骨幹,優先升級關鍵區域。我的專案經驗:Cat6A佈線成本只佔總預算15%,但收益翻倍。坑4:6GHz頻段規劃不當,覆蓋與乾擾雙重翻車6GHz帶來大量乾淨頻譜(新加坡開放5925-6425MHz),但傳播距離短、穿牆差,很多團隊直接沿用5GHz規劃,結果會議室信號弱、戶外無法使用。 Wi-Fi 7 320MHz頻道主要在6GHz實現,需AFC(自動頻率協調)支援高功率模式。低功率LPI模式下覆蓋半徑僅5GHz的60%。用戶端無法優先連6GHz,整體網路壅塞回落2.4/5GHz。單獨規劃6GHz覆蓋,增加AP密度(每AP覆蓋半徑減少),使用專用掃描射頻監控干擾。啟用自動頻道選擇(ACS)和DFS。試行測試SNR>25dB才能啟用320MHz。坑5:MLO多鏈路操作配置錯誤,優勢變劣勢MLO是Wi-Fi 7核心殺手鐧(多頻段同時傳輸),但預設開啟後,舊設備協商失敗導致全網掉速;或鏈路切換邏輯混亂,造成“乒乓切換”高延遲。 MLO支援MLMR/EMLSR/EMLMR模式,需WPA3加密+相容客戶端。配置不當會觸發單鏈路fallback。 AR/VR、8K視訊卡頓,延遲從<5ms飆到50ms+。單獨建立MLO專用SSID,僅允許Wi-Fi 7客戶端存取;舊設備走傳統SSID。使用控制器統一管理連結優先權(6GHz>5GHz>2.4GHz)。開啟802.11r快速漫遊輔助MLO切換。坑6:忽略客戶端相容性,混合環境拉低全網效能90%企業客戶端仍是Wi-Fi 6/5設備,強行全網Wi-Fi 7後,舊設備無法協商4096-QAM和寬頻道,反而佔用更多空氣時間。混合模式下BSS Coloring失效,舊設備觸發保護幀,降低整體效率。新設備也跑不快,投訴不斷。分階段遷移:先Wi-Fi 7專用SSID測試,再逐步關閉舊頻段。使用客戶端隔離或Airtime Fairness策略。建議購買支援Wi-Fi 7的筆記本/手機(Intel BE200、MediaTek等)。坑7:頻道管理與前導碼打孔使用不當盲目開320MHz導致鄰道幹擾;Preamble Puncturing配置錯誤,浪費頻譜。 Wi-Fi 7支援多RU(Resource Unit)和動態頻道寬度,需控制器自動最佳化。高密度區吞吐下降30%。開啟自動頻道與寬度管理,定期頻譜分析。工業環境優先80/160MHz穩健頻道。坑8:安全配置落後,WPA3強制特性被忽略Wi-Fi 7強制WPA3+Beacon Protection,舊設備WPA2會降級全網安全。 6GHz只允許WPA3,GCMP-256加密。合規審計不過,易遭KRACK等攻擊。全網強制WPA3,啟用Enhanced Open過渡。部署NAC動態分段。坑9:高密度環境AP部署密度錯誤以為Wi-Fi 7“一個AP頂三個”,結果高密度區(會議廳、工廠)AP太少或太多,造成自乾擾。 16空間流MU-MIMO需合理密度,過度部署增加CCI。實際容量不升反降。以每用戶0.5-1Mbps規劃AP數量,並結合熱圖調整功率(TPC)。坑10:維運監控工具跟不上,問題發現落後買了設備卻用舊管理系統,無法監控MLO狀態、4096-QAM利用率、AFC合規。需支援Wi-Fi…
-
DEll 技術認證-DELL中階儲存解決方案設計認證考試:D-MSS-DS-23
Dell Technologies Certified-Dell Midrange Storage Solutions Design 2023 Exam:D-MSS-DS-23DEll 技術認證-DELL中階儲存解決方案設計認證考試:D-MSS-DS-23認證概述D-MSS-DS-23專業認證考試能夠讓您深入了解戴爾 Unity 和 PowerStore 中階儲存解決方案。對於從事戴爾中階儲存陣列解決方案設計工作的專業人士而言,這將是一項理想的認證。 Dell Midrange Storage Solutions Design Exam:D-MSS-DS-23考試詳情:考試時間:90 分鐘題數:48可選語言:英語、法語、中文、日文 考試大綱:本次考試可能涵蓋的主題包括:中階儲存解決方案最佳實務 (36%) 戴爾中階儲存解決方案規劃、容量規劃與設計 (40%) 戴爾中階容量規劃解決方案 (24%)
-
網工基礎 | SDN思科SD-Access
網工基礎 | SDN(1)思科SD-AccessSD-Access是什麼?SD-Access(SoftwareDefined Access)軟體定義的接入,如同SD-WAN,ACI一樣,SDA是透過軟體的方式來定義企業網路。在一個整合化的控制平台,運作維與管理,統一下發策略、網路設備配置等。透過將網路功能與硬體分離,SD-Access 可實現開放性和可擴展性並降低營運成本,並在此基礎上確保策略一致性,促進更快速啟動新業務服務,顯著加快問題解決速度。SDN的核心理念是轉控分離,而SD-Access Fabric的角色包含Border、CP(Control-Plane)和Edge。CP節點:管理終端和網路設備關係的映射系統,和LISP協定有關。Border節點:一個Fabric設備(類比核心設備),用於連接Fabric和外部的3層網路。Edge節點:一個Fabric設備(類比接取層或分佈層設備)用來連接有線終端。 思科SD-Access優勢 SD-Access的五大功能 網工基礎 | SDN(2)思科SD-WAN什麼是SD-WAN?SD-WAN 是一種管理 WAN 的軟體定義方法。主要優勢包括:透過MPLS、4G/5G LTE 和其他連接類型的傳輸獨立性降低成本 。提高應用程式效能並提高敏捷性。優化軟體即服務 ( SaaS ) 和公有雲應用程式的使用者體驗和效率。透過自動化和基於雲端的管理簡化操作。 為什麼現在要使用 SD-WAN?傳統廣域網傳統的 WAN(廣域網路)功能是將分行或園區的使用者連接到託管在資料中心伺服器上的應用程式。通常,使用專用 MPLS 電路來幫助確保安全和可靠的連接。這在以雲端為中心的世界中是行不通的。 當今的 IT 挑戰時代改變了。隨著企業在多個雲端中採用 SaaS 和基礎架構即服務 (IaaS) 應用程序,IT 意識到用戶應用程式體驗很差。這是因為為不同時代設計的 WAN 還沒有為雲端採用帶來的 WAN 流量的空前爆炸做好準備。此流量導致管理複雜性、應用程式效能不可預測性和資料漏洞。 此外,將企業開放給 Internet 和雲端會暴露出重大的威脅和合規性問題。當包括員工、合作夥伴、承包商、供應商和客人在內的各種員工存取應用程式時,保護企業的關鍵資產極具挑戰性。在 WAN 上啟用寬頻使安全要求更加嚴格,這給 IT 在平衡使用者體驗、安全性和複雜性方面帶來了挑戰。新廣域網新的商業模式推動了對新網路模式的需求。SD-WAN 解決了目前的 IT 挑戰。這種新的網路連接方法可以降低營運成本並提高多站點部署的資源使用率。網路管理員可以更有效地使用頻寬,並且可以幫助確保關鍵應用程式的高效能,而不會犧牲安全性或資料隱私。 SD-WAN 有什麼好處?統的 WAN 架構僅限於企業、分公司和資料中心。一旦組織採用 SaaS 和 IaaS…
-
網路卡Bonding雙網卡綁定實戰:讓伺服器網路永不中斷
前言 干运维这行十年了,见过太多因为单网卡故障导致的生产事故。记得2019年那会,某电商客户双十一当天,核心交易服务器的网卡突然挂了,整整断网40分钟,直接损失几百万。事后复盘,其实就是一块几十块钱的网卡坏了,但因为没做任何冗余,结果损失惨重。 从那以后,我就把网卡Bonding当成服务器上架的标配操作。这玩意配置起来不复杂,但能在关键时刻救命。今天就把这些年踩过的坑、总结的经验都写出来,希望能帮到同行们少走弯路。 一、Bonding技术概述 1.1 什么是网卡Bonding 简单说,Bonding就是把多块物理网卡绑定成一个逻辑网卡。对上层应用来说,它只看到一个网络接口,但底层实际上有多块网卡在工作。这样做有两个核心好处: 第一是高可用。任何一块物理网卡坏了,流量自动切换到其他网卡,业务无感知。 第二是带宽聚合。多块网卡的带宽可以叠加使用,比如两块千兆网卡绑定后理论上能跑到2Gbps。 Linux内核从2.0版本就开始支持Bonding了,到现在已经非常成熟稳定。2025年的主流发行版,不管是RHEL 9、Ubuntu 24.04还是Debian 12,都对Bonding有完善的支持。 1.2 Bonding的工作原理 Bonding驱动在内核层面工作,它会创建一个虚拟的bond接口,然后把多个物理网卡(称为slave)挂载到这个虚拟接口下面。所有发往bond接口的流量,都会根据配置的模式分发到各个slave网卡上。 从协议栈的角度看,流量是这样走的: Bond接口有自己的MAC地址,默认会使用第一个slave网卡的MAC。当然这个可以手动指定,后面会讲到。 1.3 为什么要用Bonding而不是其他方案 有人可能会问,现在不是有很多高可用方案吗,比如Keepalived、HAProxy这些,为啥还要用Bonding? 这里要搞清楚一点:Bonding解决的是单机网卡层面的冗余,而Keepalived这些解决的是服务层面的冗余。两者不是替代关系,而是互补关系。 举个例子,你用Keepalived做了MySQL主从切换,但如果主库的网卡坏了,Keepalived检测到故障需要时间,切换也需要时间,这期间业务就是中断的。但如果主库本身做了Bonding,网卡坏了流量瞬间切换,Keepalived根本感知不到,业务完全无损。 所以我的建议是:关键业务服务器,Bonding是必须的,在此基础上再叠加服务层面的高可用方案。 二、Bonding模式详解 Linux Bonding支持7种工作模式,编号从0到6。每种模式的特点和适用场景都不一样,选错模式可能达不到预期效果。下面逐个分析。 2.1 Mode 0:balance-rr(轮询模式) 这是最简单的模式,数据包轮流从各个slave网卡发出去。比如第一个包从eth0发,第二个包从eth1发,第三个包又从eth0发,以此类推。 优点: 缺点: 适用场景: 说实话,生产环境我几乎不用这个模式。因为数据包乱序的问题在高负载下会很明显,可能导致TCP重传增加,反而降低性能。如果你的场景主要是UDP流量,可以考虑。 2.2 Mode 1:active-backup(主备模式) 这是我用得最多的模式。顾名思义,同一时间只有一块网卡在工作,其他网卡作为备份。主网卡故障时,自动切换到备份网卡。 优点: 缺点: 适用场景: 大多数需要高可用但对带宽要求不那么极端的场景。比如数据库服务器、应用服务器、管理网络等。这个模式我推荐作为默认选择,除非有特殊需求。 2.3 Mode 2:balance-xor(异或模式) 这个模式根据源MAC地址和目标MAC地址做异或运算,结果决定用哪块网卡发送。相同的源目地址对,总是走同一块网卡。 优点: 缺点: 适用场景: 需要负载均衡且交换机支持静态聚合的场景。 2.4 Mode 3:broadcast(广播模式) 所有数据包都从所有slave网卡发送出去。…
