近日,存儲(chǔ)產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟、中國電子技術(shù)標(biāo)準(zhǔn)化研究院聯(lián)合華中科技大學(xué)、西北工業(yè)大學(xué)、山東省計(jì)算中心、之江實(shí)驗(yàn)室、杭州海康威視數(shù)字技術(shù)股份有限公司、中移動(dòng)信息技術(shù)有限公司、長江存儲(chǔ)科技有限責(zé)任公司等20多家學(xué)研機(jī)構(gòu)、企業(yè)和用戶代表,共同發(fā)布業(yè)界首個(gè)《AIGC數(shù)據(jù)存儲(chǔ)技術(shù)研究報(bào)告》(以下簡稱:《報(bào)告》)。
《報(bào)告》首次系統(tǒng)梳理并深入分析了AIGC場景下的數(shù)據(jù)存儲(chǔ)需求,探討了數(shù)據(jù)存儲(chǔ)技術(shù)如何應(yīng)對AIGC帶來的挑戰(zhàn),并為數(shù)據(jù)存儲(chǔ)產(chǎn)業(yè)的未來發(fā)展提供了寶貴的參考和指引。中國電子技術(shù)標(biāo)準(zhǔn)化研究院副院長范科峰表示:生成式人工智能激發(fā)了海量數(shù)據(jù)存儲(chǔ)的復(fù)雜多樣需求,數(shù)據(jù)存儲(chǔ)技術(shù)已成為發(fā)展生成式人工智能的挑戰(zhàn)性問題和技術(shù)瓶頸之一;《報(bào)告》系統(tǒng)分析了AIGC產(chǎn)業(yè)的創(chuàng)新發(fā)展態(tài)勢,從數(shù)據(jù)存儲(chǔ)的角度揭示了AIGC技術(shù)的內(nèi)在邏輯,為推動(dòng)AIGC技術(shù)的持續(xù)創(chuàng)新發(fā)展提供進(jìn)一步的支撐。
《報(bào)告》以其系統(tǒng)深入的分析和獨(dú)到的視角,為數(shù)據(jù)存儲(chǔ)技術(shù)發(fā)展帶來了全新的啟示。《報(bào)告》不僅提出了應(yīng)對當(dāng)前AIGC數(shù)據(jù)存儲(chǔ)技術(shù)難點(diǎn)的解決方案,還對未來數(shù)據(jù)存儲(chǔ)架構(gòu)的發(fā)展趨勢進(jìn)行了預(yù)判,為有關(guān)行業(yè)企業(yè)發(fā)展和學(xué)術(shù)研究提供了重要參考。
《AIGC數(shù)據(jù)存儲(chǔ)技術(shù)研究報(bào)告》
一、AIGC數(shù)據(jù)存儲(chǔ)六大關(guān)鍵需求及應(yīng)對技術(shù)
《報(bào)告》以AIGC全作業(yè)流程不同階段的存儲(chǔ)要求為基礎(chǔ),提煉了數(shù)據(jù)處理、容納、管理、安全、共享和流動(dòng)等六個(gè)維度的需求,并就支撐每個(gè)維度需求的技術(shù)點(diǎn)進(jìn)行詳細(xì)闡述。
1. 數(shù)據(jù)處理方面:以數(shù)控分離、內(nèi)核親和力調(diào)度、小文件聚合為代表的關(guān)鍵技術(shù),能夠顯著提升數(shù)據(jù)存儲(chǔ)和訪問效率。
2. 數(shù)據(jù)容納方面:通過高密硬件設(shè)計(jì)、大容量存儲(chǔ)介質(zhì)、數(shù)據(jù)壓縮和重刪技術(shù)為大容量存儲(chǔ)提供了新的選擇。
3. 數(shù)據(jù)管理方面:全局文件系統(tǒng)等技術(shù)能夠?qū)崿F(xiàn)數(shù)據(jù)的集中管理和有效治理。
4. 數(shù)據(jù)安全方面:通過故障恢復(fù)、故障預(yù)測、數(shù)據(jù)安全防護(hù)技術(shù),提供從“治已病”到“治欲病”再到“治未病”的全方位數(shù)據(jù)安全保護(hù)。
5. 數(shù)據(jù)共享方面:多協(xié)議融合互通技術(shù)能夠提升數(shù)據(jù)處理效率,降低存儲(chǔ)成本。
6. 數(shù)據(jù)流動(dòng)方面:數(shù)據(jù)分層、數(shù)據(jù)跨域流動(dòng)通過構(gòu)建統(tǒng)一命名空間和數(shù)據(jù)視圖,實(shí)現(xiàn)跨平臺(tái)、跨形態(tài)、跨地域的全局?jǐn)?shù)據(jù)管理。
AIGC場景下數(shù)據(jù)存儲(chǔ)關(guān)鍵需求圖
二、四大場景應(yīng)用體現(xiàn)優(yōu)勢和效果
基于分布式存儲(chǔ)和備份歸檔的AIGC數(shù)據(jù)存儲(chǔ)解決方案,滿足數(shù)據(jù)采集、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)訓(xùn)練、數(shù)據(jù)推理和數(shù)據(jù)歸檔五個(gè)階段的能力,可以提供端到端的數(shù)據(jù)支持,滿足面向文本、音頻、圖像、視頻、代碼以及多模態(tài)和全模態(tài)的大模型數(shù)據(jù)處理的需求。
《報(bào)告》通過多個(gè)經(jīng)典案例,展示AIGC數(shù)據(jù)存儲(chǔ)技術(shù)在實(shí)際應(yīng)用中的優(yōu)勢和效果。
1. 高校:科研平臺(tái)數(shù)據(jù)存儲(chǔ)解決方案,提供了高性能和高可用性的存儲(chǔ)系統(tǒng),支持全數(shù)據(jù)生命周期管理,為跨學(xué)科領(lǐng)域研究提供了安全可靠的數(shù)據(jù)存儲(chǔ)底座。
2. 大模型:AIGC計(jì)算框架存儲(chǔ)解決方案,將異構(gòu)計(jì)算匯聚,提供了高性能存儲(chǔ)系統(tǒng)和多種數(shù)據(jù)特征提取、整合能力,為用戶“再創(chuàng)新,再發(fā)現(xiàn)”提供了強(qiáng)力的工具。
3. 醫(yī)療:醫(yī)學(xué)影像存儲(chǔ)解決方案,滿足了大規(guī)模醫(yī)學(xué)影像生成模型訓(xùn)練的需求,提供了高效的數(shù)據(jù)處理和存儲(chǔ)能力,以及強(qiáng)大的數(shù)據(jù)安全和隱私保護(hù)機(jī)制。
4. 金融:金融數(shù)據(jù)高效存取解決方案,采用分布式全閃系統(tǒng)和統(tǒng)一存儲(chǔ)系統(tǒng),提供了極高的IOPS和極低延遲,解決了分析建模和訓(xùn)練過程中的性能瓶頸問題。
三、AIGC催生新一代數(shù)據(jù)存儲(chǔ)架構(gòu)
展望未來,《報(bào)告》認(rèn)為AIGC數(shù)據(jù)存儲(chǔ)技術(shù)的發(fā)展將呈現(xiàn)多個(gè)趨勢。其中,數(shù)據(jù)綠色存儲(chǔ)將愈發(fā)成為關(guān)注的焦點(diǎn),通過實(shí)施數(shù)據(jù)分層存儲(chǔ)、數(shù)據(jù)去重和壓縮等技術(shù),提高存儲(chǔ)系統(tǒng)的能效和降低企業(yè)存儲(chǔ)成本。同時(shí),數(shù)據(jù)安全存儲(chǔ)的重要性也日益凸顯,需要加強(qiáng)數(shù)據(jù)保護(hù)與安全技術(shù)的研究和應(yīng)用。
此外,AIGC技術(shù)的快速發(fā)展還將催生新一代數(shù)據(jù)存儲(chǔ)架構(gòu)的誕生,新一代存儲(chǔ)架構(gòu)將圍繞著更低成本、更高性能、更低能效、更大容量、更豐富的管理、更快速的運(yùn)維的方向持續(xù)演進(jìn),這也將加速數(shù)據(jù)存儲(chǔ)產(chǎn)業(yè)的快速增長和標(biāo)準(zhǔn)的完善。《報(bào)告》呼吁各行業(yè)共同努力推動(dòng)技術(shù)創(chuàng)新和標(biāo)準(zhǔn)制定工作,以滿足用戶對高質(zhì)量、高效率數(shù)據(jù)存儲(chǔ)的需求。
在數(shù)字化轉(zhuǎn)型的激流中,AIGC技術(shù)正引領(lǐng)著數(shù)據(jù)處理的新革命,而數(shù)據(jù)存儲(chǔ)作為這一變革的堅(jiān)實(shí)基石,其戰(zhàn)略地位日益凸顯。《報(bào)告》的發(fā)布,將為數(shù)據(jù)存儲(chǔ)領(lǐng)域注入了新的動(dòng)力,推動(dòng)數(shù)據(jù)存儲(chǔ)行業(yè)將邁向更加廣闊的發(fā)展前景,開啟智能存儲(chǔ)的新篇章。