Chatgpt淘汰搜索?中信不信!
就在上周,谷歌23號(hào)員工Paul Buchheit表示,像ChatGPT這樣的人工智能聊天機(jī)器人將像搜索引擎殺死黃頁一樣摧毀谷歌。
面對(duì)ChatGPT的威脅,谷歌已經(jīng)緊張起來了。上周五,谷歌母公司Alphabet CEO桑達(dá)爾·皮查伊谷歌將在“未來幾周或幾個(gè)月”推出類似ChatGPT、基于人工智能的大型語言模型。
曾經(jīng)的屠龍者,如今要成為被屠的巨龍了嗎?
【資料圖】
中信證券分析師陳俊云等認(rèn)為,ChatGPT要想取代傳統(tǒng)搜索引擎,還早得很,類似的人工智能聊天機(jī)器人,甚至都無法撼動(dòng)當(dāng)前全球搜索引擎市場(chǎng)競(jìng)爭(zhēng)格局,但可以推動(dòng)相關(guān)技術(shù)加速落地.
中短期內(nèi)很難取代傳統(tǒng)搜索引擎
分析師在試用ChatGPT時(shí)發(fā)現(xiàn),相較于傳統(tǒng)搜索引擎提供內(nèi)容相關(guān)頁面鏈接,ChatGPT可以直接生成面向問題的高完成度回答,并能夠提供回答內(nèi)容的相關(guān)引用鏈接(目前測(cè)試版本尚未開發(fā)這一功能)。此外針對(duì)開放式問題,ChatGPT也可以通過匹配網(wǎng)絡(luò)中的數(shù)據(jù)生成較為完整的答案,在處理知識(shí)類以及創(chuàng)意類的問題時(shí),ChatGPT提供的搜索體驗(yàn)遠(yuǎn)勝于目前的傳統(tǒng)搜索引擎。
但是,?分析師認(rèn)為,ChatGPT目前還存在三個(gè)致命的不足之處:
1)?數(shù)據(jù)的實(shí)時(shí)性問題。目前英文版本的ChatGPT數(shù)據(jù)截至2021年,而中文版本的ChatGPT數(shù)據(jù)截至2020年,數(shù)據(jù)庫版本滯后的主要原因是由于語言類大模型的技術(shù)限制。ChatGPT目前的在GPT大模型上加入標(biāo)注數(shù)據(jù)訓(xùn)練模式讓實(shí)時(shí)數(shù)據(jù)的引入非常困難,如果要重新預(yù)訓(xùn)練模型,我們估計(jì)每次預(yù)訓(xùn)練需要用到1000塊以上的英偉達(dá)A100顯卡工作半個(gè)月至一個(gè)月的時(shí)間,成本在百萬美元以上。而如果采用使用微調(diào)的方式專門訓(xùn)練新知識(shí),會(huì)導(dǎo)致新知識(shí)的在模型內(nèi)的權(quán)重過高,頻繁的微調(diào)也會(huì)導(dǎo)致模型“遺忘”舊的知識(shí)。
2)數(shù)據(jù)的真實(shí)性仍不足可靠。在大量的測(cè)試后我們發(fā)現(xiàn),雖然ChatGPT回答問題的準(zhǔn)確性有所提高,但如果提出的問題較為模糊或者本身包含部分錯(cuò)誤信息在內(nèi),模型有可能以“一本正經(jīng)”的語氣生成完全錯(cuò)誤甚至憑空捏造的回答。真假答案的混雜會(huì)讓用戶在需要對(duì)專業(yè)性問題尋求答案時(shí)產(chǎn)生嚴(yán)重的困擾,這也是目前語言類大模型普遍存在的問題。據(jù)CSDN微信公眾號(hào)報(bào)道,2022年11月幾乎同一時(shí)間上線的Meta服務(wù)科研領(lǐng)域的語言類大模型Galactica就因?yàn)檎婕俅鸢富祀s的問題,測(cè)試僅僅3天就被用戶投訴下線。
3)模型在線推理端成本高昂。根據(jù)模型的現(xiàn)有數(shù)據(jù),我們假設(shè)每次生成的回答長(zhǎng)度平均為50個(gè)詞,使用8x英偉達(dá)A100用于推理的情況下,我們估算ChatGPT每一次生成答案的成本約為1.3美分,約為谷歌搜索引擎每次搜索成本的3倍。如果每天面對(duì)數(shù)以億計(jì)用戶的搜索請(qǐng)求,如此高昂的成本是公司所不能承受的,中短期內(nèi)完全取代傳統(tǒng)搜索引擎在商業(yè)模式上無法做到。
難以撼動(dòng)現(xiàn)有搜索市場(chǎng)格局,但可以推動(dòng)相關(guān)技術(shù)加速落地
除了ChatGPT背后的OpenAI,谷歌、百度等搜索大廠均在大語言模型上有深厚的積累,尤其是谷歌,其部分技術(shù)還要在ChatGPT之上。
隨著谷歌計(jì)劃將類似的AI聊天機(jī)器人融入搜索引擎中,中信預(yù)計(jì)ChatGPT的成功不會(huì)給搜索產(chǎn)業(yè)帶來顛覆性的新入局者。但?ChatGPT的攪局,足以在搜索引擎中掀起“軍備競(jìng)賽”,加速大語言模型相關(guān)技術(shù)的迭代。
分析師指出,目前的搜索引擎巨頭可以借助ChatGPT的功能,來優(yōu)化搜索時(shí)的用戶體驗(yàn),主要有三個(gè)方向:
風(fēng)險(xiǎn)提示及免責(zé)條款 市場(chǎng)有風(fēng)險(xiǎn),投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議,也未考慮到個(gè)別用戶特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。1)考慮到ChatGPT在不同分類問題中的表現(xiàn)情況,限制ChatGPT搜索僅在知識(shí)類搜索場(chǎng)景下啟用可以有效控制成本。
2)面對(duì)時(shí)效類問題時(shí),模型自動(dòng)判斷轉(zhuǎn)向傳統(tǒng)搜索引擎生成答案,并通過傳統(tǒng)搜索引擎的數(shù)據(jù)返回生成ChatGPT版本的匯總新答案。
3)針對(duì)回答真實(shí)性問題,加入對(duì)答案產(chǎn)生來源的引用注明給用戶,讓用戶可以快速檢驗(yàn)回答的可靠性。