Solidigm:高容量SSD需求井噴,儲存為何對於AI如此重要?

CFMS2024上,SK海力士和Solidigm發錶瞭聯閤演講,Solidigm亞太區銷售副總裁倪錦峰先生以“夯實存力基礎,釋放數據價值”為主題,闡述瞭存儲對於AI應用的意義,並錶示Solidigm和SK海力士優勢互補,為産業鏈閤作夥伴提供完整的存儲解決方案。

為何存儲對於AI如此重要?

AI是一項極為重要的技術革命,隨著應用場景不斷拓展和架構演變,模型功能日漸強大,存儲扮演的角色越來越重要。首先,AI智能模型需要更多的數據持續進化。倪錦峰先生稱,自GPT應用開始發展,GPT模型的訓練參數量持續攀升,GPT-3已擁有數十億參數,而GPT-4更是高達數萬億參數。通過引入更多數據進行學習,大語言模型的智能水平進一步提升,譬如許多LLM基於常見的Common Crawl Corpus語料庫構建的,而語料庫會每隔3到4個月定期捕獲信息,2008年至今已纍積13至15PB的文本數據,並且這種數據體量還在持續增長。

其次,存儲對於AI重要性還體現在成本、功耗和空間的優化。GPU需要高性能存儲來支持提高訓練效率,若存儲性能不足,GPU可能會長時間處於空閑狀態。數據顯示,在某些應用場景中,存儲占服務器功耗約35%,若通過更高存儲密度和其它優化措施來降低這一比例,將節省大量的電力和成本。倪錦峰先生錶示,北美等地客戶正在關注32TB、64TB甚至128TB超大容量的SSD需求,可以看到在AI高速發展下,客戶對功耗等方麵的擔憂。

除瞭北美等地區最近湧現瞭較多超大容量SSD的需求以外,Solidigm在國內也看到瞭類似的需求,倪錦峰先生直言,Solidigm與國內許多企業有閤作案例,譬如金山雲之前有一個基於硬盤的對象存儲解決方案,在全麵轉嚮瞭閃存陣列的新方案後,人工智能訓練時所用的40TB原始數據集加載時間由近9小時(535分鍾)縮短到11分鍾左右,這主要是得益於存儲産品的升級改進。

AI技術的興起,正推動存算去中心化,NAND能夠更好滿足復雜的需求

關於AI應用的進一步普及,倪錦峰先生錶示,這是工作負載從雲端轉移到邊緣端的過程。其中,近邊緣階段需最大限度減少數據流量並降低成本,通過遠邊端增加輕量級訓練或強化學習,可以減緩數據流量的損失並提高效果。隨著模型規模擴張和邊緣數據處理增長,邊緣存儲需求將持續增長。高性能閃存以簡化管理、減少空間、減少耗電和散熱成本等優勢,逐漸成為大型數據中心和雲計算的首選存儲方案。除此以外,AI技術的興起正推動計算和存儲去中心化,傳統技術很難滿足邊緣和遠邊緣側復雜的環境和多元化的需求。

倪錦峰先生錶示,存儲需要不斷拓展吞吐量和容量,幫助用戶最大限度地提升CPU和GPU利用率,減少計算成本開支。過去40多年,絕大多數據保存在數據中心,可以很好地考慮到擴展性、能耗、散熱和維護等問題。而隨著AI發展,去中心化的浪潮正在到來,相對於本地化存儲,數據從邊端傳輸到雲數據中心所需的成本要高約4倍,所以存儲必須更好地適應存儲本地化的趨勢,來解決與雲端數據中心的距離問題。另外,存儲設備往往扮演身兼數職的角色,在執行訓練任務時,需要處理檢查點任務或其他並行通道的準備任務,這會形成更復雜的混閤I/O工作負載。在這些方麵,SSD相較HDD除瞭擁有更好的性能和更優的TCO以外,在麵對並發性或多租戶環境的混閤流量時,更占據優勢。

倪錦峰先生錶示,SSD的應用,為AI工作負載提速,優化瞭基礎設施,助力GPU利用率更高,而AIGC的應用僅是開端,將通過與閤作夥伴的深入閤作,進一步挖掘QLC SSD在AI 存力中發揮的潛力。

倪錦峰先生錶示, Solidigm正在批量齣貨第四代192L QLC NAND,推動閃存嚮更高密度和更低成本演進,為客戶實際應用中創造價值並帶來更好的使用體驗,這也將持續激勵著QLC技術發展和産品創新,更好地釋放數據價值。



最新推薦閱讀:

  • SK海力士:全係列NAND Solution提供商麵嚮多模態AI時代

  • 美光計算與存儲:推動人工智能(AI)革命

  • 20年一遇的PC革新,英特爾暢談AI PC和存儲應用

  • 鎧俠:PCIe 5.0技術和QLC SSD應用展望

  • 本周存儲現貨行情持平為主,上遊堅定保利潤漲價,現貨市場持保守態度

  • CFMS2024會後專題:三星與客戶同行,共築創新之路