熱點在線丨AI投資的下一步是什么?
近期,360董事長周鴻祎談?wù)揂I時表示:
“算力不是最關(guān)鍵的問題,場景和數(shù)據(jù)是關(guān)鍵。有知識量的數(shù)據(jù),中文語料占了不到5%,大量知識在外文期刊里面。想要給具體行業(yè)賦能,讓AI成為某一個領(lǐng)域的專家,就必須使用對應(yīng)領(lǐng)域的專業(yè)數(shù)據(jù)來訓(xùn)練。
【資料圖】
未來國內(nèi)各個大廠都會推自己的大模型,微軟、谷歌以及未來國內(nèi)大廠的模型相當于一個通用模型,大而不精。想要給具體行業(yè)賦能,成為某一個領(lǐng)域的專家,就必須使用對應(yīng)領(lǐng)域的專業(yè)數(shù)據(jù)來訓(xùn)練?!?/p>
興業(yè)證券分析師王楠等指出,數(shù)據(jù)、算法和算力是大模型最重要的三要素。AI投資除了算力和算法,更要重視數(shù)據(jù)。
人工智能的根基是訓(xùn)練,只有通過大量的訓(xùn)練,神經(jīng)網(wǎng)絡(luò)才能總結(jié)正確的規(guī)律進行應(yīng)用。訓(xùn)練的基礎(chǔ)除了算力和算法,更需要海量的優(yōu)質(zhì)數(shù)據(jù)。
而近期BloombergGPT的橫空出世,更為市場展現(xiàn)了根據(jù)優(yōu)質(zhì)垂直數(shù)據(jù)AI進行訓(xùn)練的大語言模型的強大之處。該模型依托彭博社的大量金融數(shù)據(jù)源,構(gòu)建了一個3630億個標簽的數(shù)據(jù)集,支持金融行業(yè)內(nèi)的各類任務(wù),在執(zhí)行金融任務(wù)上的表現(xiàn)遠超過現(xiàn)有模型,在通用場景上的表現(xiàn)與現(xiàn)有模型也能一較高下。
因此,分析師認為,只有掌握核心行業(yè)數(shù)據(jù),才能訓(xùn)練出適用于行業(yè)應(yīng)用的垂直行業(yè)大模型。
分析師進一步強調(diào),國資云掌握的海量優(yōu)質(zhì)數(shù)據(jù)對訓(xùn)練中國的垂直行業(yè)大模型意義重大:
結(jié)合近期據(jù)發(fā)改委官方批露:我國政府數(shù)據(jù)資源占全國數(shù)據(jù)資源的比重超過3/4,但開放規(guī)模不足美國的10%。個人和企業(yè)可以利用的規(guī)模更是不及美國的7%。
以“國資云+垂直領(lǐng)域模型”方式,可以確保敏感重點行業(yè)原始數(shù)據(jù)不出域,加速推動行業(yè)的智能化轉(zhuǎn)型升級。而為了保障重點行業(yè)數(shù)據(jù)資源的安全,未來國內(nèi)大模型的數(shù)據(jù)存儲和運算,勢必會更大程度使用自主可控的國家隊算力資源。
與此同時,美國加大AI相關(guān)產(chǎn)業(yè)鏈制的裁力度背景下,大模型“國家級”平臺智源研究院,與中國電子云、中國移動九天人工智能團隊等兩大央企集團,合作加速推進國產(chǎn)化大模型發(fā)展,加速自主可控國產(chǎn)化AI大模型發(fā)展進程,國內(nèi)算力自主可控需求迫切。
因此,未來在垂直場景數(shù)據(jù)、數(shù)據(jù)安全、AI大模型自主可控需求背景下,我們認為AI投資下一步要重視“數(shù)據(jù)要素+國資云”。
總結(jié)來看,具備運營、治理政務(wù)數(shù)據(jù)、及重點行業(yè)、關(guān)鍵垂直領(lǐng)域數(shù)據(jù)的”數(shù)據(jù)要素運營商“、以及央國企背景的自主可控國資云廠商,有望迎來價值重估。
本文主要觀點來自興業(yè)證券王楠(執(zhí)業(yè):S0190520120004)等發(fā)布的報告《AI投資下一步,重視“數(shù)據(jù)要素+國資云”》,有刪節(jié)
風(fēng)險提示及免責(zé)條款 市場有風(fēng)險,投資需謹慎。本文不構(gòu)成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見、觀點或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負。關(guān)鍵詞: