昨天,,百度搜索突然小范圍內(nèi)測了對話式 AI ,號稱對標(biāo) New Bing ,,還具有聯(lián)網(wǎng)能力,。
如果是真的,,那百度這回又是國內(nèi)第一家整出有聯(lián)網(wǎng)功能大模型的公司了。
巧了的是,,我也剛好拿到了資格,,又能帶大家趕個熱乎的了。
廢話不多說啊,,咱們就上手試試這個對標(biāo) New Bing 的百度新產(chǎn)品,。
如果你是能搶先體驗的用戶,在百度搜索界面的引導(dǎo)欄里,,你就能看到排在第一個的 AI 對話,。
點進去之后,,整體的聊天界面非常簡潔,。使用方法跟 New Bing 一樣,都是對話形式,。
至于跟自己的親哥文心一言,到底有啥區(qū)別,,它本人是這么說的,。
不是一個東西,不是一個模型,,甚至不是一家公司,。
但據(jù)報道,,這個對話 AI ,明明是基于文心一言開發(fā)的,。
但考慮到New Bing 也曾“ 發(fā)表”過自己是百度家產(chǎn)品的炸裂言論,畢竟對大語言模型來說,,偶爾胡言亂語也算正常,。
這玩意真能聯(lián)網(wǎng)嗎?所以為了驗證它連上網(wǎng)線沒,,趕緊著問了道測聯(lián)網(wǎng)的問題:
百度發(fā)布智能手機,。
這回,,它給了我正確的回答,,并且貼上了資料來源的“百家號”鏈接。
起碼證明了,,百度的這個產(chǎn)品,,確實是能夠聯(lián)網(wǎng)的,。
既然這樣,咱們干脆來個橫評測試,,看看百度和New Bing兩個聯(lián)網(wǎng)大模型的能力到底誰比較厲害,。
這不,今天上午,,熱騰騰的 NBA 比賽剛剛結(jié)束,。那第一題,就問它們:NBA 最新比分,。
結(jié)果讓我有點吃驚,, New Bing 和百度居然都犯了同樣的錯誤。
兩個參賽選手抓取的網(wǎng)頁都是對的,,都貼了 NBA 官網(wǎng)的鏈接,。
但是,盡管已經(jīng)翻到了對的那一頁,,兩個選手總結(jié)出來的比分都錯了,。
熱火和尼克斯真正的比分是 103 : 112 ,,湖人對勇士是 106 : 121 。
怎么對著答案抄,,居然都能抄錯的,。
第一局,雙方都沒得分,。
那第二題,,我們來點最近的互聯(lián)網(wǎng)熱梗——華語樂壇新四大天王。
雖然在我提示之后,,百度抓取到了正確的文章鏈接,,給出了一份對的人員名單。
但是,,當(dāng)我追問到代表作的時候,,百度這小子又忘了,現(xiàn)在的華語樂壇,,到底誰是真天王了,。
至于 New Bing 這邊,,全程發(fā)揮穩(wěn)定,,一首“ 雪Distance ”驚艷全場。
這場華語樂壇角逐,到底還是微軟技高一籌,。
第三題,我覺得還是犯璞歸真,,聊聊咱們普通人搜索概率更大的問題,。
結(jié)果,,百度可以通過調(diào)用百度天氣的數(shù)據(jù),,給你更精準(zhǔn)的資料,甚至還有一個賞心悅目的圖注,。
New Bing就有點傻傻分不清楚了,直接把 “ 接下來5天 ” 理解成了過去 5 天的天氣情況,。
1比1平,,局面頓時焦灼了起來。
那決勝的最后一題,,我想試一些聯(lián)網(wǎng)功能,,給日常生活帶來的便利。
這里,,我讓它們給我規(guī)劃一下路線:從創(chuàng)景路到 in77 最快的路線,。
本來,,百度有自家的百度地圖,,我覺得這一局,應(yīng)該是百度穩(wěn)贏,。
結(jié)果出乎意料的是,, New Bing 居然抄著百度的家伙,把百度 AI 給碾壓了,。
New Bing 直接調(diào)用了百度地圖,,很快就規(guī)劃出了一條可用的路線。
雖然答案稍微有點小問題,,因為 19 號線地鐵剛剛開通到創(chuàng)景路。New Bing 提供的 5 號線,,已經(jīng)不是最快方案了,。
但是,,不管怎么說,,比百度的回答好。
它給出的幾個路線全都不對,尤其是第一條步行的建議,,更是相當(dāng)炸裂,。
創(chuàng)景路距離 in77 有 19 公里,一刻不停的走,,也得走 4 個小時 34 分鐘,。
但經(jīng)過北京小伙伴的測試,,它其實是能用調(diào)用百度地圖的,。
至于究竟是怎么一個調(diào)用邏輯,咱家不太清楚了,。
這么幾輪血戰(zhàn)下來,在 New Bing 面前,,百度還是略顯遜色的,。
總的來看,百度的搜索 AI 肯定是有聯(lián)網(wǎng)能力的,,這個是沒有異議的,。
但可能因為還是內(nèi)測,使用起來很不穩(wěn)定,,比如抓取的資料內(nèi)容質(zhì)量不高,、對鏈接文章內(nèi)容總結(jié)不準(zhǔn)確等等。
只不過讓我比較納悶兒的是,,有些時候,,這個對話 AI 可能還不如身為“離線劃水”的文心一言來的靠譜。
就拿我們首測文心一言的經(jīng)典案例“松鼠桂魚的做法”來說,。
如果說文心一言平平淡淡的發(fā)言只能給 60分的話,。
那這個對話 AI ,,就只能算 30分,。
答案不夠詳細就算了,甚至還在抄人家卷子的時候,,把隔壁同學(xué)的名字都給抄過來了,。
引用鏈接里,人家分享說自己“廚房燈光暗,,改刀看不清楚,!”,百度把這種“口水話”都照搬上去,。
這不是無腦打小抄的小學(xué)僧嘛,。
當(dāng)然了,這也不能全怪百度,。
我覺得,,主要還是目前互聯(lián)網(wǎng)上,互相都不夠開放的原因,。比如百度就不容易抓到微信上的內(nèi)容,。
再加上,百度AI引用的鏈接更傾向是百度百科等百度系的內(nèi)容,,自產(chǎn)直銷,。
這么一來,,導(dǎo)致參考的資料可能不夠多元,,就容易出問題。
不過,,針對這個問題,已經(jīng)把 AI 玩出花來的編輯部同事,,就給我安利了一個小妙招,。
可以通過英文互聯(lián)網(wǎng)的資料譯回中文,直接曲線救國,。
還真別說,內(nèi)容質(zhì)量好像有肉眼可見的提高,。
但是,,引用不準(zhǔn)確還可以理解,一些基本大模型能力,,怎么也比文心一言遜色不少,。
后面又試了幾道弱智吧問題,基本招招致命,。
怎么還質(zhì)疑起游戲NPC造假了
關(guān)于“張三差點沒上上上上海的車”的問題,明明它差一點就理解對了,。
結(jié)果,當(dāng)我給它開個了后門——再給他一次機會的時候,,他不僅直接選擇“擺爛“,,甚至還通過引用數(shù)據(jù)來嚇唬我。
讓你引用數(shù)據(jù)的時候,引用錯了,頂嘴的時候,,又引用得比誰都快,。
當(dāng)然了,,百度這次的新產(chǎn)品,,也不是沒有優(yōu)化升級的。
除了聯(lián)網(wǎng)之外,,還跟Bing一樣,,支持對話文成圖,甚至在頁面左下角,,開了一個叫“靈感中心”的東西,。
里面全都是各種 AI 生成的小工具,比如解夢,、抽象畫,,甚至還有賽博求簽。
粗看起來,,是有點兒AI應(yīng)用商店那味兒了,。
而且,,在使用過程中,,我發(fā)現(xiàn)這個對話 AI ,好像一直致力于給你解決更具體的問題,。
既然它這么渴望,,我就給他們來一道加時賽——應(yīng)用題,。
說實話,光看這個標(biāo)題倒是挺驚艷的,。
結(jié)果,我想讓百度順便給我生成對應(yīng)圖片的時候,,它就罷工了,。
這牛脾氣,真不知道是跟誰學(xué)的,。
最后,我只能指名道姓地說出描述對象,,讓它給我畫個歐洲早餐店圖,。
當(dāng)然,,出于合規(guī)的要求,還是會顯示 AI 作圖的水印,,這該死的求生欲,。
為了公平起見,,我們也用 New Bing 重復(fù)了這個步驟,,分別生成了一段文案和一張圖。
最后,咱們把兩個圖片和文案,,同時丟到小紅書上,。看看到底誰的效果更好,。
雖然百度的瀏覽量會越高一絲,,但是 Bing 比百度多了兩個點贊數(shù)。所以這道題就算是開放式題目了,,具體哪個更好,,相信每個茶友都有自己的答案。
最后總結(jié)一下,,整體玩下來,還是能感覺到百度這產(chǎn)品和 New Bing 的客觀差距,。
但是考慮到,,這只是初代版本,并且也還只是在小范圍測試,,以目前 AI 的更新速度來看,,相信很快就會有體驗上的提升。
北京航空航天大學(xué)的教授吳文峻說過一個觀點,,生成式 AI 的特點就是生成,,所以不可避免會出現(xiàn)幻覺問題。
解決這個問題的唯一辦法,,就是需要更長的技術(shù)演進,。要用看待人類學(xué)習(xí)進化的觀點,去看待 AI 的發(fā)展,。
至少在我看來,,在微軟一騎絕塵的 AI 時代,百度能做出來,,并且敢推出這個產(chǎn)品,,已經(jīng)是相當(dāng)不易了,。
首先我們要有,這樣才能談演進,,談進化,。
文章出處:差評