華經科技股份有限公司 售前規劃師/謝宗翰
隨著2025年的到來,各國面臨氣候變化、經濟復甦及全球供應鏈問題等多重挑戰。與此同時,AI的迅速發展更推動了數據處理和存儲需求的增長,特別是在深度學習和機器學習等領域,對資料傳輸速度和效率的要求愈加嚴苛。
GPUDirect Storage(GDS)作為一種專為解決GPU與儲存設備之間資料瓶頸而設計的創新架構,正逐漸成為AI應用中的關鍵組件。例如,在氣候變化方面,GDS支援的高效資料處理能力,可以幫助各國政府和企業優化能源使用、預測氣候模式;在經濟復甦方面,GDS技術能夠協助企業快速適應市場變化,提高運營效率,加速創新;而在全球供應鏈管理中,高效的資料流通及管理亦離不開GDS這樣強大的基礎設施支援。GDS以其卓越的性能正為多領域應用提供解決方案,助力各產業應對未來挑戰。
本文將深入探討GDS的架構、效能優勢以及其在實際應用中的情境,特別是針對支援GDS的儲存設備進行詳細分析。
GDS傳輸架構
GDS技術的核心在於直接記憶體存取(DMA),這使得儲存裝置能夠直接與GPU進行資料傳輸,而無需經過主機CPU。這一過程省略了將資料複製到主機記憶體的步驟,顯著降低了延遲並減輕了CPU負擔。Nvidia宣稱,使用GDS可以實現2到8倍的資料傳輸頻寬提升。
GDS工作原理
在傳統架構中,從儲存裝置到GPU的數據必須經過多個步驟,包括CPU和系統記憶體。這樣不僅增加了延遲,還限制了整體效能。而在GDS架構下,數據只需通過PCIe交換器即可直接載入GPU記憶體,大幅減少了延遲和CPU負擔。

效能提升與算法
如VAST Data所提供的測試數據顯示,GDS技術顯著提高了數據傳輸效率。例如在某案例中,一個AI訓練任務使用了8個InfiniBand埠來連接資料來源。透過啟用GDS後,持續傳輸率從33 GB/s提升至94 GB/s,CPU負荷則從99%降至15%。
將效能提升的數值代入公式:
=94−3333×100%≈184.85% =3394−33×100%≈184.85%
這顯示出GDS在高負載環境下的卓越效能。

(Less compute time & more I/O)
支援GDS的儲存設備類型
GDS架構支援多種儲存設備,主要分為以下幾類:
- 內部NVMe SSD:這些儲存裝置直接安裝在GPU伺服器內部,提供最低的存取延遲。
- 外部區塊型儲存裝置:通過NVMe-oF協定連接,這類設備能夠擴展容量和頻寬。
- 外部檔案系統:這些系統支援RDMA技術,能夠與GDS無縫整合以實現高效能資料傳輸。
GDS架構優勢
- 降低延遲:透過省略將資料複製到主機記憶體的步驟,GDS顯著減少了資料傳輸中的延遲。這對於需要即時反應的應用場景尤為重要,如金融交易和自動駕駛。
- 減輕CPU負擔:由於主機CPU不參與資料傳輸作業,因此可以專注於其他計算任務,提高整體系統效率。這使得資源利用更加合理,有助於提升整體效能。
- 提高頻寬利用率:透過直接連接GPU和儲存裝置,GDS避免了傳統架構中CPU成為頻寬瓶頸的問題。因此,在高需求環境下,例如大規模AI模型訓練或即時資料分析中,可以實現更高效、更穩定的資料流。
- 成本效益:雖然初期投資可能較高,但長期來看,由於效能提升和資源利用率提高,可以顯著降低運營成本。例如,在金融機構中,由於交易速度加快,可以更有效地利用市場機會,提高收益。
GDS技術正在各行業被採納
隨著AI技術的快速發展,不同行業正積極探索如何運用GPUDirect Storage(GDS)技術,來實現數據管理、跨平台整合、縮短開發時程等,以達到數據決策的目標,幫助組織在多變的市場環境中保持競爭優勢。
資料管理與流通
在零售業中,數據分析的時效性至關重要。一家大型零售商透過採用支援GDS技術的儲存解決方案,成功建立了自動化數據管道。使得企業可以輕鬆地管理跨多個環境(如核心、邊緣和雲端)的數據流動。顯著縮短了數據分析報告的生成時間,從一周縮短至一天,使決策更加迅速而精確。
跨平台整合
製造業則面臨跨平台數據整合的挑戰。而支援GDS技術的儲存解決方案通常具備強大的跨平台整合能力,可以無縫地將不同來源的數據彙整到一起,讓企業能夠更快地獲取洞察和做出決策。一家製造業公司借助GDS技術,將工廠現場數據與雲端分析平台無縫結合,提升了生產效率並顯著減少停工時間。
縮短開發週期
在科技與創新領域,AI模型開發速度對於競爭力尤為重要。一家科技初創公司利用支援GDS的高效儲存解決方案,將模型訓練時間從數天縮短至數小時,不僅加速了產品開發進程,還使其更靈活地應對市場變化。
GDS在儲存設備中的應用情境
情境一:金融機構高頻交易分析
金融機構會進行高頻交易分析,需要快速處理大量數據。如若選擇了一款支援GDS的外部區塊型儲存設備。透過NVMe-oF連接,該設備能夠在毫秒級別內完成資料讀取和寫入,大幅提高了交易策略的反應速度。透過使用GDS技術,該機構的數據處理效率顯著提升,使其能夠更快地回應市場變化。
情境二:醫療影像處理
醫療機構需要處理大量醫療影像資料以進行診斷。如選擇了一個支援RDMA技術的外部檔案系統,以便於與GDS整合。在進行影像分析時,醫療機構發現其資料讀取速度大幅提升,並且能夠更快地產生診斷報告。具體而言,在啟用GDS後,其影像處理流程中的延遲時間顯著減少,使得醫生能夠更迅速地做出診斷決策。
情境三:自動駕駛汽車資料處理
在自動駕駛汽車領域,大量感測器產生的資料需要即時處理以確保安全性和可靠性。如若選擇了一款支援GDS的內部NVMe SSD作為其資料處理平台。透過直接將感測器資料寫入GPU記憶體,公司能夠即時分析路況資訊,提高了反應速度和準確性。啟用GDS後,其資料處理延遲時間顯著降低,使得自動駕駛系統能夠更快地做出反應。
情境四:大型影片渲染工作室
大型影片渲染工作室需要處理大量高解析度影片素材,以便快速產出最終產品。如選擇了一款支援RDMA技術的外部檔案系統,並與GDS整合,在進行影片渲染時,可預期渲染速度顯著提升,並且能夠同時處理更多影片素材。具體而言,在啟用GDS後,其渲染流程中的平均處理時間可以大幅縮短,也使得工作室能夠更有效率地完成項目。
隨著AI技術的不斷演進,各行各業對於資料處理速度和效率的要求愈加苛刻。GPUDirect Storage作為一種創新且高效的傳輸架構,不僅能夠顯著提升資料傳輸效能,同時也減輕了主機CPU的負擔,使得AI應用能夠在更高效的平台上運行。
未來,隨著更多支援GDS技術的儲存設備問世,其在各行各業中的應用將會更加廣泛。透過不斷推進技術邊界,我們有理由相信,GDS將成為AI世代的新引擎,推動各行各業向前發展。未來,我們期待看到更多基於此架構的新型應用及解決方案出現,以滿足日益增長的市場需求。同時,各企業也應積極探索如何最佳化其基礎設施,以充分發揮GDS帶來的潛力,實現業務轉型與升級。