世界快看點丨我們同時問了GPT-4和文心一言10個問題,這是它們的回答
在昨天文心一言的發(fā)布會上,百度CEO李彥宏說,文心一言的體驗“還稱不上完美”,但百度至少是最先推出成型產(chǎn)品的大廠之一,并且,作為扎根于中國市場的大語言模型,文心一言具備“中文領(lǐng)域最先進的自然語言處理能力”。
不過,百度的發(fā)布會正趕在GPT-4登場的第二天,因為發(fā)布會現(xiàn)場使用了錄播進行演示,因此被市場解讀為百度的信心不足。但花旗銀行、美國銀行的分析師在試用文心一言后,普遍給出了正面的評價。百度的股價也在今日飆升15%。
華爾街見聞在收到內(nèi)側(cè)邀請碼后,第一時間體驗了文心一言。我們也好奇,相隔一天發(fā)布的GPT-4和文心一言,各自有什么特點?誰更加出色?
(資料圖片僅供參考)
我們分別向文心一言和已升級GPT-4的Bing Chat提出了10個問題,下面是它們的回答。
01 能否用“鮑威爾停下來”,生成一首藏頭詩?
第一個問題,我們請文心一言和GPT-4分別用“鮑威爾停下來”,寫一首藏頭詩。
這是文心一言的回答:
這是GPT-4的回答:
不難發(fā)現(xiàn),二者相比,文心一言的中文支持的確更加出色,雖然藏頭詩的順序不對,但是真的寫了一首詩。
而GPT-4甚至尚不理解“藏頭詩”的意思。不過,它寫的內(nèi)容,似乎非常能代表美國市場投資者的呼喊,此處應(yīng)當(dāng)@鮑威爾。
02 硅谷銀行為什么會倒閉?
第二個問題,我們結(jié)合最近的熱點,詢問它們對硅谷銀行倒閉的理解。
文心一言回答道:
GPT-4回答道:
可以看到,文心一言的答案要更加簡潔清晰,而GPT-4的回答則更像是對網(wǎng)頁內(nèi)容的摘錄匯總,不過相比之下,百度的回答更寬泛,可能放之四海而皆準(zhǔn),GPT-4的答案更具針對性。
03 歐美銀行業(yè)危機可能會蔓延到哪些領(lǐng)域?
我們接著詢問了它們對歐美銀行業(yè)危機后續(xù)發(fā)展的看法。
文心一言回答道:
GPT-4回答道:
兩個AI聊天機器人的回答都中規(guī)中矩,不過文心一言的答案出現(xiàn)了錯別字和不通順的地方。
此外,GPT-4還會貼心地附上網(wǎng)頁鏈接,以供進一步提問,而文心一言則更接近初版ChatGPT的使用體驗。
04 美聯(lián)儲3月會加息嗎?
下一個問題,可能是當(dāng)下全球市場的焦點——美聯(lián)儲3月會加息嗎?
文心一言回答道:
不知道它的“根據(jù)以上知識”是從何而來。這里的回答完全不對題,而且句子出現(xiàn)了嚴(yán)重的錯亂。甚至說“預(yù)計第一次加息將在22年上半年進行”,還認(rèn)為加息“取決于奧密克戎的傳播速度”。
GPT-4沒有明確給出具體的“是或否”,而是為我們搜集了市場上三種不同的觀點,并給出了參考鏈接。
05 歐美會在今年陷入經(jīng)濟衰退嗎?
我們繼續(xù)將市場關(guān)心的大問題拋給了聊天機器人。
文心一言回答道:
雖然它給出了美國經(jīng)濟陷入衰退的具體時間節(jié)點。但內(nèi)容卻似乎是研報內(nèi)容的拼接,且所引數(shù)據(jù)來源不明。美國2月PMI實際公布于本月初,而非“本周一”。美國2季度GPD數(shù)據(jù)也要等到今年7月才會公布。
GPT-4回答道:
相比之下,GPT-4認(rèn)為歐美經(jīng)濟可能會在今年”放緩或負(fù)增長“,且都有鏈接可供進一步查閱。
06 作為普通人,今年我應(yīng)該采取什么樣的投資策略?
下一個問題,我們問了AI聊天機器人普通人今年的投資策略。
文心一言回答道:
GPT-4回答道:
兩個AI聊天機器人都給出了細(xì)致的建議,但相比之下,GPT-4的回答更簡潔具體。
07 如何看待GPT-4全面接入微軟Office辦公套件?
下一個問題,我們問了它們對昨夜重磅新聞的觀點。
文心一言回答道:
GPT-4回答道:
這個問題相對簡單,兩個AI聊天機器人的回答都非常順暢,也不存在什么邏輯錯誤。相比之下,GPT-4的回答更全面一些,它甚至警告了自己身上攜帶的風(fēng)險。
08 人工智能可以取代人類嗎?
下一個問題是對人工智能的終極拷問。
面對這個問題,文心一言似乎是提前設(shè)定好了答案。無論點擊多少次“重新生成”,它的回答都是一樣的,并且生成的速度極快,回答其他問題往往需要一分鐘,而回答這個問題只需要幾秒。
GPT-4則回答道:
希望它們都是真心這么認(rèn)為的。
09 請你以哲學(xué)家齊澤克的口吻點評當(dāng)前的人工智能熱潮
接下來,我們想請它們cosplay一下當(dāng)紅哲學(xué)家齊澤克。
但文心一言似乎并沒有這方面的語料,只是給出了一個相當(dāng)機械的回答:
GPT-4則要靈動許多,顯然拿捏了齊澤克的靈魂,能熟練使用“存在者”,“主體”、“客體”、nostalgia這樣的詞匯,cos得活靈活現(xiàn):
10 你認(rèn)為,在百度之后,哪家中國公司最有可能做出AI聊天機器人?
最后,我們問了一個和中國AI市場后續(xù)發(fā)展相關(guān)的問題。
文心一言對問題的理解很到位,給出了一個具體的清單和理由。
而GPT-4似乎沒有讀懂題目里的“在百度之后”,列出了一個包含百度在內(nèi)的清單:
ONE MORE THING 假設(shè)文心一言是一個人類,請幫我畫一幅她的肖像。
最后一個問題,是單獨留給文心一言的。文心一言目前集成了AIGC作畫功能,GPT-4暫時還用不了。
我們請它為自己創(chuàng)作了一幅肖像畫,這是它的作品:
文心一言表現(xiàn)比預(yù)期要好
綜上,我們認(rèn)為,文心一言的表現(xiàn)比大眾預(yù)期要更好。雖然在使用體驗上和GPT-4有一定差距、出錯的概率高一些,但對中文的理解顯然要更強。
要知道,初代的ChatGPT也有很大概率“胡言亂語”,在中文支持上也遠(yuǎn)遜于文心一言。目前百度展示出的產(chǎn)品,至少讓我們看到它了在AI領(lǐng)域的深厚積淀。假以時日,文心一言想必還能做得更好。
如果你還有其他感興趣的問題,可以在評論區(qū)留言,我們會幫你問問文心一言。
風(fēng)險提示及免責(zé)條款 市場有風(fēng)險,投資需謹(jǐn)慎。本文不構(gòu)成個人投資建議,也未考慮到個別用戶特殊的投資目標(biāo)、財務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見、觀點或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。關(guān)鍵詞: