近日,存儲產業技術創新戰略聯盟、中國電子技術標準化研究院聯合華中科技大學、西北工業大學、山東省計算中心、之江實驗室、杭州海康威視數字技術股份有限公司、中移動信息技術有限公司、長江存儲科技有限責任公司等20多家學研機構、企業和用戶代表,共同發布業界首個《AIGC數據存儲技術研究報告》(以下簡稱:《報告》)。
《報告》首次系統梳理并深入分析了AIGC場景下的數據存儲需求,探討了數據存儲技術如何應對AIGC帶來的挑戰,并為數據存儲產業的未來發展提供了寶貴的參考和指引。中國電子技術標準化研究院副院長范科峰表示:生成式人工智能激發了海量數據存儲的復雜多樣需求,數據存儲技術已成為發展生成式人工智能的挑戰性問題和技術瓶頸之一;《報告》系統分析了AIGC產業的創新發展態勢,從數據存儲的角度揭示了AIGC技術的內在邏輯,為推動AIGC技術的持續創新發展提供進一步的支撐。
《報告》以其系統深入的分析和獨到的視角,為數據存儲技術發展帶來了全新的啟示。《報告》不僅提出了應對當前AIGC數據存儲技術難點的解決方案,還對未來數據存儲架構的發展趨勢進行了預判,為有關行業企業發展和學術研究提供了重要參考。

《AIGC數據存儲技術研究報告》
一、AIGC數據存儲六大關鍵需求及應對技術
《報告》以AIGC全作業流程不同階段的存儲要求為基礎,提煉了數據處理、容納、管理、安全、共享和流動等六個維度的需求,并就支撐每個維度需求的技術點進行詳細闡述。
1. 數據處理方面:以數控分離、內核親和力調度、小文件聚合為代表的關鍵技術,能夠顯著提升數據存儲和訪問效率。
2. 數據容納方面:通過高密硬件設計、大容量存儲介質、數據壓縮和重刪技術為大容量存儲提供了新的選擇。
3. 數據管理方面:全局文件系統等技術能夠實現數據的集中管理和有效治理。
4. 數據安全方面:通過故障恢復、故障預測、數據安全防護技術,提供從“治已病”到“治欲病”再到“治未病”的全方位數據安全保護。
5. 數據共享方面:多協議融合互通技術能夠提升數據處理效率,降低存儲成本。
6. 數據流動方面:數據分層、數據跨域流動通過構建統一命名空間和數據視圖,實現跨平臺、跨形態、跨地域的全局數據管理。

AIGC場景下數據存儲關鍵需求圖
二、四大場景應用體現優勢和效果
基于分布式存儲和備份歸檔的AIGC數據存儲解決方案,滿足數據采集、數據準備、數據訓練、數據推理和數據歸檔五個階段的能力,可以提供端到端的數據支持,滿足面向文本、音頻、圖像、視頻、代碼以及多模態和全模態的大模型數據處理的需求。
《報告》通過多個經典案例,展示AIGC數據存儲技術在實際應用中的優勢和效果。
1. 高校:科研平臺數據存儲解決方案,提供了高性能和高可用性的存儲系統,支持全數據生命周期管理,為跨學科領域研究提供了安全可靠的數據存儲底座。
2. 大模型:AIGC計算框架存儲解決方案,將異構計算匯聚,提供了高性能存儲系統和多種數據特征提取、整合能力,為用戶“再創新,再發現”提供了強力的工具。
3. 醫療:醫學影像存儲解決方案,滿足了大規模醫學影像生成模型訓練的需求,提供了高效的數據處理和存儲能力,以及強大的數據安全和隱私保護機制。
4. 金融:金融數據高效存取解決方案,采用分布式全閃系統和統一存儲系統,提供了極高的IOPS和極低延遲,解決了分析建模和訓練過程中的性能瓶頸問題。
三、AIGC催生新一代數據存儲架構
展望未來,《報告》認為AIGC數據存儲技術的發展將呈現多個趨勢。其中,數據綠色存儲將愈發成為關注的焦點,通過實施數據分層存儲、數據去重和壓縮等技術,提高存儲系統的能效和降低企業存儲成本。同時,數據安全存儲的重要性也日益凸顯,需要加強數據保護與安全技術的研究和應用。
此外,AIGC技術的快速發展還將催生新一代數據存儲架構的誕生,新一代存儲架構將圍繞著更低成本、更高性能、更低能效、更大容量、更豐富的管理、更快速的運維的方向持續演進,這也將加速數據存儲產業的快速增長和標準的完善。《報告》呼吁各行業共同努力推動技術創新和標準制定工作,以滿足用戶對高質量、高效率數據存儲的需求。
在數字化轉型的激流中,AIGC技術正引領著數據處理的新革命,而數據存儲作為這一變革的堅實基石,其戰略地位日益凸顯。《報告》的發布,將為數據存儲領域注入了新的動力,推動數據存儲行業將邁向更加廣闊的發展前景,開啟智能存儲的新篇章。

