技術丨思科的 NVMe-oF 的部署錦囊都在這兒了

思科聯天下

引言

在上一期的介紹中,我們探討了 NVMe 技術和 NVMe-oF 不同的技術優缺點。今天來看看該如何選擇合適的 NVMe-oF 技術,以及思科的解決方案和針對不同金融場景下的建議。

對於計劃升級基礎設施以支持 NVMe-oF 的金融行業 IT 架構師來說,主要問題是採用何種技術架構。自然,答案將取決於他們當前基礎設施的內容,以及他們對未來的計劃和預算。

另一個關鍵因素是時機。 NVMe/RoCEv2 目前顯示出潛力,但在準備好可靠地承擔企業級關鍵工作負載之前,它可能還需要幾年的時間來發展。當技術成熟時,NVMe/TCP 看起來也可能提供出色的性價比,但這同樣也需要幾年的時間。

目前,大多數 IT 架構師得出結論,FC 為企業關鍵任務工作負載提供了最成熟的數據傳輸協議,使 NVMe/FC 成為正確的存儲網絡架構選擇。

複雜的協議棧不是存儲的最佳選擇

NVMe 協議比 SCSI 協議更有效的原因之一是 NVMe 的協議棧明顯更簡單。協議堆棧的簡化性也非常重要,因此我們可以對比一下不同的 NVMe 結構的協議堆棧。光纖通道、RoCEv2 和 TCP 的堆棧在下面的存儲 Fabric 協議全棧圖中可以看到差別。

IP/以太網相對於光纖通道的複雜性是顯而易見的。協議中有幾個關鍵問題導致了這種複雜性:以太網和 IP(以及 TCP/UDP)在比光纖通道 FC 更獨立的層中實現傳輸渠道。 IP 網絡的設計初衷是必須支持具有數十億個節點的全球範圍地址分配和路由,需要多個複雜的層面和算法支持。光纖通道 FC 是為數據中心規模設計的,有其自身的複雜性,但比 IP 的全球規模要簡單得多。

以太網是在網絡早期作為一種最佳共享介質開發的。該協議演變了多種用於避免環路、快速地址學習等的零碎機制。多年來,流量控制逐漸得到加強。相比之下,光纖通道的開發人員能夠從這些早期的經驗教訓中吸取教訓,從而創建一個整體上更加一致的協議。

對協議棧的要求。光纖通道一直專注於高級數據中心用例,因此沒有向更大的規模發展。

在這里承認TCP 和RoCEv2 堆棧的複雜性並不一定會增加微不足道的延遲;許多堆棧複雜性由啟用RDMA 的專用NIC 或TCP offload 在“硬件” 中處理(儘管通常涉及基於ASIC 的處理器內核)引擎。但複雜的堆棧在實際部署中會轉化為配置管理、互操作性、故障排除與分析等多方面的挑戰。

IP/以太網複雜性的遺留問題代表了優質、無損環境中的挑戰:設備的默認行為以及支持人員的經驗和培訓主要面向主流市場。雖然應該可以利用一些高級操作來配置以太網和 IP 設備,但這種操作不是正常的默認設置,通常也不是網絡運維中不同角色的能力所及。相比之下,光纖通道始終被設計為簡單的高可用網絡,這在 NVMe 環境中和幾十年來在 SCSI 環境中一樣都是如此。

新堆棧創建新的安全目標

在光纖通道 SAN 中維護高價值存儲資產的優勢之一是此類結構很難通過 IP 網絡訪問。從 IP 協議到穩定的光纖通道協議棧,根本沒有路徑。攻擊者無法通過 IP 發送光纖通道幀來探測 SAN。因此,經常出現的小安全漏洞不會轉化為存儲卷的零日漏洞。複雜且相對未經驗證的 RoCEv2 和 TCP 堆棧開闢了新的威脅面,這些威脅面相對可通過 IP 訪問,從而增加了整個組織 IP 網絡中安全機制管理的複雜性。

企業存儲架構遷移的考慮

NVMe over Fibre Channel 提供光纖通道傳輸的性能和穩健性,以及在同一基礎設施上同時運行 FCP 和 FC‑NVMe 協議的能力。這種雙協議方法使 IT組織能夠將其存儲卷從 SCSI 順利過渡到 NVMe,有了 NVMe over Fibre Channel,當組織開始採用 NVMe 時,無需推倒和替換 SAN,也無需創建昂貴的新基礎設施。雙協議 HBA 和驅動程序堆棧意味著每個存儲應用程序都可以根據需要逐步遷移。 SCSI 資產可以逐卷地從 SCSI 遷移到 NVMe。低風險的性能敏感卷可以先遷移,風險敏感的捲可以保留到以後。此外,可以在頂級企業陣列上創建和維護關鍵資產的主副本,同時可以將運營副本發佈到同一 SAN 中的低成本陣列,以供其他應用程序使用。

金融行業應用可以通過多種方式受益於 NVMe 技術。所以,建議路線圖應該適用於多種 NVMe 解決方案實施。

決定部署哪種類型的NVMe over Fabrics 協議取決於應用,您的數據中心技術設施能力以及這些應用程序對NVMe over RoCE、NVMe over FC 或NVMe over TCP的準備情況,完善的解決方案將支持所有這些協議,

思科針對 NVMe-oF 部署的建議

建議NVMe/FC 協議和SCSI/FC 協議使用相同的光纖通道基礎設施,並使用不同的VSAN 來保持NVMe 和SCSI FC 流量之間的分離, NVMe/FC 提供更高的性能和更好的錯誤恢復( SLER),目前光纖通道速度為64G,128G 標準正在研究中。

整體的方案示意如下:

Cisco MDS 提供豐富的基於ASIC 的NVMe/FC 分析功能,以及用於進一步分析NVMe 幀的專用附加NPU,目前基於以太網技術的NVMe over ROCEv2 和NVMe over TCP 還沒有基於芯片級別的可以分析NVMe 幀的能力。

思科的 MDS SAN 解決方案能提供對 NVMe/FC 完整的支持

這是客戶在涉及 SAN 的對話中最常見且最關心的問題。 Cisco MDS SAN 完全支持 NVMe。

•透明支持 —— 無需額外的硬件/命令
•可與任何當前使用 Cisco NX-OS 8.x 版本的 16G/32G 交換矩陣交換機或當前 Cisco MDS 9700 16G/32G 模塊配合使用
•無需額外許可證
•無需額外功能即可識別 NVMe 命令

針對 NVMe 的整體部署方案,思科提出了 NVMe-Anywhere 整體解決方案

該方案建議通常 NVMe/RoCEv2 使用無損以太網部署在機架內, 流量工程通過 DSCP、PFC、ECN、DCQCN、IB/CNP 功能進行管理,以發揮 NVMe/RoCEv2 的最佳性能。對 NVMe/RoCEv2 進行故障排除需要了解 Infiniband TH 協議。 NVMe/RoCEv2 不能用於長距離(NVMe/TCP 是更好的選擇),因此在一部分場合可以部署 NVMe/TCP 解決方案。採用思科的N9K 解決方案實現NVMe/RoCEv2和NVMe/TCP的同時,N9K支持FC/FCoE 的特性,配合思科MDS 交換機可以實現全棧全連通的NVMe over Fabric 數據中心解決方案,實現真正的NVMe-Anywhere才是客戶現實環境的最佳選擇,同時兼容現有SAN 環境,實現無縫遷移,多級存儲,新老設備共存,充分體現投資保護。

在思科 NVMe-Anywhere 整體解決方案下,思科提出針對 NVME-oF 的選擇建議:

•將企業級關鍵任務應用程序部署在 NVMe/FC 光纖通道環境中;
• 關鍵業務的存儲遷移可以在統一的 FC 結構上直接進行,從 SCSI 遷移到 NVMe/FC;
• 對於某些考慮較低成本或者較長距離需求的 NVMe 存儲數據流量,可以使用 NVMe/TCP ;
• 針對 cloud native 兼容的部分應用場景,可以考慮採用 NVMe/RoCEv2 作為 DAS 替代,目前狀態下流量應盡可能限制在機架級別(低於 TOR 交換機);
• 存儲網絡要具備 NVMe 流量的可視分析能力;
• 通過統一的融合管理平台管理混合結構 (Ethernet/FC) 。

綜上,在目前的階段下,針對金融行業的應用特點,大部分使用場景以確保關鍵業務的可靠性和安全性為首要目標。因此,選擇成熟、穩定、安全的 NVMe/FC 技術作為關鍵業務場景的首選,對於非關鍵業務場景可以考慮其他類型的 NVMe-oF 技術。思科公司憑藉完備的產品線和經驗豐富的技術支持能力,可以幫助金融行業客戶採用 NVMe 技術支持各種類型的應用,實現 NVMe-Anywhere。