從GPT-4?VS?文心一言暢談百度的未來
隨著AI的大火,最近AI圈可謂風(fēng)云際會(huì),各方大佬紛紛登場(chǎng)。在3月14日,GPT-4的發(fā)布會(huì)圓滿結(jié)束,3月15日,百度的李彥宏也做了文心一言的發(fā)布會(huì),沒看過的小伙伴,可以在網(wǎng)上搜搜發(fā)布會(huì)的視頻。
“文心一言”各種梗圖
百度真“人工”智能
機(jī)智的網(wǎng)友讓GPT-4評(píng)價(jià)文心一言,上演現(xiàn)實(shí)版的同行相輕
發(fā)布會(huì)上李彥宏步履蹣跚,表情略顯緊張,沒有往日的自信從容。那么百度的文心一言和GPT相比到底實(shí)力如何?是騾子是馬,咱們拉出來遛遛。
GPT-4 VS 文心一言
接下來主要從多模態(tài)生成,數(shù)理邏輯推算,編程方面,擬人化,算力方面,中文理解,應(yīng)用生態(tài)等方面分析下到底誰強(qiáng)誰弱
GPT-4
OpenAI老板Sam Altman評(píng)價(jià)GPT-4是目前為止最強(qiáng)的AI,根據(jù)OpenAI官方的介紹,GPT-4是一個(gè)超大的多模態(tài)模型,它的輸入可以是文字(上限2.5萬字),還可以是圖像
最令人驚訝的是只需要簡(jiǎn)單在紙上畫一個(gè)網(wǎng)站的草稿圖,拍一張照片上傳給GPT-4,它就可以立馬生成網(wǎng)站的HTML代碼?。ㄒ院蟪绦騿T真要失業(yè)了)
OpenAI自稱:在各種專業(yè)和學(xué)術(shù)基準(zhǔn)上和人類相當(dāng)!敢這么狂妄,背后還是有東西的!
多模態(tài)能力
所謂多模態(tài)能力,即可以接受圖像輸入并理解圖像內(nèi)容,并且可接受的文字輸入長(zhǎng)度也增加到3.2萬個(gè)字符(約2.4萬單詞)。比如模擬律師考試,GPT-4取得了前10%的好成績(jī),相比之下GPT-3.5是倒數(shù)10%,做美國高考SAT試題,GPT-4也在閱讀寫作中拿下710分高分、數(shù)學(xué)700分(滿分800)
看圖能力可以用來解釋表情包、梗圖
提問這張圖哪里好笑?GPT-4可以按順序描述出每一格的內(nèi)容,并總結(jié)出笑點(diǎn):
用巨大的過時(shí)VGA接口給小巧的現(xiàn)代智能手機(jī)充電
數(shù)理邏輯推算
發(fā)GPT-4可以理解圖表中數(shù)據(jù)的含義,并做進(jìn)一步計(jì)算
編程方面
發(fā)布會(huì)直播上,OpenAI總裁現(xiàn)場(chǎng)表演了一波GPT-4給代碼修Bug
出現(xiàn)問題啥也不用想,直接把2.4萬字的程序文檔一股腦扔給GPT-4就行。你只需要精通CV(復(fù)制粘貼)大法即可
并且能在幾秒鐘內(nèi)瞬間得到解決辦法
擬人化
GPT-4還開放了一個(gè)使用功能,允許修改“系統(tǒng)提示”,使其感覺更像真人一樣!之前ChatGPT的回答總是冗長(zhǎng)而平淡,這是因?yàn)橄到y(tǒng)提示中規(guī)定了“你只是一個(gè)語言模型……你的知識(shí)截止于2021年9月。現(xiàn)在通過修改“系統(tǒng)提示”,GPT-4就可以展現(xiàn)出更多樣的性格,比如扮演蘇格拉底
應(yīng)用生態(tài)
必應(yīng)早就用上了GPT-4,并得到了微軟方面的證實(shí)
微軟給OpenAI提供超算服務(wù)吸引企業(yè)來使用Azure訓(xùn)練自己的大模型,同時(shí)直接在Azure中提供OpenAI模型服務(wù)(Azure OpenAI Service),此前包括GPT-3、Codex和DALL·E 2等模型,都已經(jīng)接入Azure
中文理解
GPT-4在中文理解方面的確稍遜一籌。
文心一言
和GPT-4一樣,文心一言是一個(gè)多模態(tài)大模型。李彥宏會(huì)上展示了文心一言具備的5種能力,包括
文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成
文學(xué)創(chuàng)作
在文學(xué)創(chuàng)作上,李彥宏先來了一個(gè)最簡(jiǎn)單的提問,問《三體》作者是哪里人?先讓文心一言介紹一下大劉,“畢竟我(文心一言)和劉慈欣是老鄉(xiāng)嘛,都來自陽泉”
結(jié)果大錯(cuò)特錯(cuò),直接把劉慈欣的老家張冠李戴到了湖北省洪湖市
商業(yè)文案創(chuàng)作
比如給新公司起個(gè)名字,并且這個(gè)名字它還有理有據(jù),有跡可循
中文理解
發(fā)布會(huì)上,李彥宏向觀眾展示了文心一言對(duì)中文的理解能力,并自信地說:文心一言對(duì)中國文化的了解,理應(yīng)超出任何一個(gè)預(yù)訓(xùn)練大模型
為了證明這一點(diǎn),李彥宏輸入了一個(gè)問題:“洛陽紙貴。到底有多貴?”,文心一言不僅展現(xiàn)了歷史淵源,還介紹了這個(gè)成語背后的經(jīng)濟(jì)學(xué)原理
我們?cè)賮韱枂朑PT-4呢
在標(biāo)準(zhǔn)化的回答方面兩者似乎旗鼓相當(dāng)
那么,難度再提高下,看看二者寫藏頭詩的能力
GPT-4沒有真正理解“藏頭詩”的含義
在中文理解上,屬實(shí)是文心一言“小勝一籌”了。不過在英文上,李彥宏也承認(rèn),雖然文心一言也能處理,但能力是顯著不如中文的。
數(shù)理邏輯推算
數(shù)學(xué)思維能力方面,文心一言處理的數(shù)學(xué)問題不算復(fù)雜,是小學(xué)常見的雞兔同籠問題
有趣的是,李彥宏現(xiàn)場(chǎng)展示的第一題,引得文心一言說出了《狂飆》里高啟盛的經(jīng)典臺(tái)詞:這題出得不對(duì)??雌饋砀邤M人化
李彥宏表示,這些題“不敢說百分之一百能做對(duì),但至少體現(xiàn)了文心一言的思考?xì)v程”
在邏輯推理方面相比GPT-4,個(gè)人覺得文心一言處理的還是有點(diǎn)小兒科了,擬人化方面暫時(shí)先對(duì)半分吧
多模態(tài)能力
為即將到來的2023世界智能交通大會(huì)創(chuàng)作海報(bào),并且支持文字轉(zhuǎn)視頻,文字轉(zhuǎn)語音能力
相比GPT的強(qiáng)大,文心一言差的不是一星半點(diǎn)
編程方面
有些遺憾的是,在ChatGPT被頻頻稱贊的編程方面,文心一言并沒有現(xiàn)場(chǎng)展示相關(guān)能力,只能認(rèn)為目前不具備或者只具備很弱的能力,和GPT不能相提并論
算力方面
文心一言底層算力支持,是位于李彥宏老家陽泉的百度陽泉智算中心,專門為自家大模型產(chǎn)品文心一言提供計(jì)算推理的算力需求,陽泉智算中心是亞洲單體最大的智算中心,算力規(guī)??蛇_(dá)4EFLOPS(每秒400億億次浮點(diǎn)計(jì)算)
但相比微軟的大投入,上萬張英偉達(dá)A100芯片,幾十萬張GPU還是稍遜
應(yīng)用生態(tài)
目前,文心一言在百度內(nèi)部已經(jīng)接入百度搜索,小度和自動(dòng)駕駛Apollo等產(chǎn)品,外部包括愛奇藝等650家公司也已經(jīng)接入
生態(tài)方面也僅限國內(nèi)相比還是不足
文心一言背后原理
據(jù)王海峰(百度首席技術(shù)官(CTO),深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心主任)介紹,文心一言主要脫胎于兩大模型,六項(xiàng)核心技術(shù)。
兩大模型:
百度ERNIE系列知識(shí)增強(qiáng)千億大模型,以及百度大規(guī)模開放域?qū)υ捘P蚉LATO
六項(xiàng)核心技術(shù):其中三個(gè)是廣為人知的大模型技術(shù),包括有監(jiān)督精調(diào)、人類反饋強(qiáng)化學(xué)習(xí)和提示構(gòu)建。另外三個(gè),則是“百度特色”的技術(shù),
包括知識(shí)增強(qiáng)、檢索增強(qiáng)和對(duì)話增強(qiáng)技術(shù)
總結(jié)
誠然,文心一言和GPT-4還有很大差距。雖然網(wǎng)上很多人對(duì)文心一言抨擊的一文不值,批評(píng)的體無完膚,但是這也是大家對(duì)百度的期望太高。對(duì)比GPT-4的光芒萬丈就顯得自慚形穢了,但百度作為國內(nèi)AI的頭部企業(yè)實(shí)力還是不容小覷的,在中文處理方面有著得天獨(dú)厚的優(yōu)勢(shì),而且在AI的很多應(yīng)用場(chǎng)景也有著自己的貢獻(xiàn)。
希望大家能理性看待百度的文心一言,雖然還有缺陷,但隨著時(shí)間的流逝,我相信國產(chǎn)AI會(huì)有著屬于自己的輝煌,讓AI真正的服務(wù)給更多的人。
就像有句話說的,世界上不能只有一種聲音,一枝獨(dú)秀不是春,百花齊放才是春。
以上就是從GPT-4 VS 文心一言來探討百度的未來在哪里的詳細(xì)內(nèi)容,更多關(guān)于GPT-4 VS 文心一言的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
擔(dān)起凈化網(wǎng)絡(luò)環(huán)境責(zé)任 IDC行業(yè)在發(fā)展中成長(zhǎng)
在去年年底我國就掀起了互聯(lián)網(wǎng)的整風(fēng)浪潮,各行各業(yè)的整治行動(dòng)都緊鑼密鼓地進(jìn)行著。2009-09-09OpenAI發(fā)布GPT-4支持圖像文本輸入處理中文準(zhǔn)確度大幅提升
這篇文章主要為大家介紹了OpenAI正式發(fā)布GPT-4:支持圖像和文本的輸入、?處理中文的準(zhǔn)確度大幅提升,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-03-03瞄準(zhǔn)無線網(wǎng)絡(luò)商機(jī) 聚焦3G手機(jī)郵箱
3G來了,各大運(yùn)營商爭(zhēng)先恐后進(jìn)軍移動(dòng)互聯(lián)網(wǎng),手機(jī)郵箱成為運(yùn)營商開辟移動(dòng)互聯(lián)網(wǎng)的重要業(yè)務(wù)之一。2009-06-06網(wǎng)站排名有了中國標(biāo)準(zhǔn) 轉(zhuǎn)
網(wǎng)站排名有了中國標(biāo)準(zhǔn) 轉(zhuǎn)...2006-12-12互聯(lián)網(wǎng)應(yīng)用廣泛 電子商務(wù)正當(dāng)時(shí)
截止今年上半年,我國互聯(lián)網(wǎng)普及率由1997年的0.1%上升到19.1%。互聯(lián)網(wǎng)應(yīng)用越來越廣泛,以電子政務(wù)、電子商務(wù)、企業(yè)信息化等為代表的信息化應(yīng)用熱潮方興未艾。2008-12-12萬網(wǎng)CN域名免費(fèi)注冊(cè)的活動(dòng)注冊(cè)地址
自去年CN域名全民體驗(yàn)活動(dòng)以來,CN域名已穩(wěn)居國家頂級(jí)域名世界第二,毋庸置疑地成為中國互聯(lián)網(wǎng)的主流域名。2008-03-03兩會(huì)聚焦電子商務(wù) 推動(dòng)就業(yè)局勢(shì)良性發(fā)展
在國際金融危機(jī)的沖擊下,我國的就業(yè)形式正面臨著前所未有的壓力。全國兩會(huì)期間,眾多代表都在為此出謀劃策,電子商務(wù)恰恰就成為大家的首選。2009-03-03