當(dāng)前位置:首頁(yè) > 今日熱點(diǎn) > 熱點(diǎn)追蹤 > 正文

    “文心一言”正開(kāi)放實(shí)測(cè):夫妻肺片不畫夫妻了,老婆餅里仍有“老婆”

    2023-09-01 08:47:36    來(lái)源:騰訊網(wǎng)    

    8月31日,百度、百川智能、商湯科技等8家企業(yè)或機(jī)構(gòu)已首批通過(guò)《生成式人工智能服務(wù)管理暫行辦法》備案,可正式上線并面向公眾提供服務(wù)。記者通過(guò)實(shí)際測(cè)評(píng),發(fā)現(xiàn)文心一言部分文字、圖片等問(wèn)題回答比較精準(zhǔn),但一些容易引起歧義或有一定深度的問(wèn)題,則容易回答不準(zhǔn)確,甚至?xí)霈F(xiàn)類似于ChatGPT“一本正經(jīng)胡說(shuō)”的情況。


    (資料圖片僅供參考)

    對(duì)此,齊魯工業(yè)大學(xué)(山東省科學(xué)院)計(jì)算機(jī)系教授鹿文鵬解讀稱,大模型都是通過(guò)大量數(shù)據(jù)“喂”出來(lái)的,而且要靠高質(zhì)量的數(shù)據(jù)。目前在文字、圖像、設(shè)計(jì)等方面,AI聊天軟件已經(jīng)成為不錯(cuò)的輔助工具。在部分領(lǐng)域,大模型仍處于“幼兒期”,無(wú)法準(zhǔn)確把握用戶的意圖,對(duì)此應(yīng)該包容,后期通過(guò)不斷學(xué)習(xí)、進(jìn)化,當(dāng)數(shù)據(jù)量大到一定程度,它所達(dá)到的能力將比我們想象地要強(qiáng)很多。

    實(shí)測(cè)“文心一言”:會(huì)順著用戶的話說(shuō),畫老婆餅仍會(huì)有“老婆”

    31日,記者打開(kāi)文心一言官網(wǎng)測(cè)評(píng)體驗(yàn)。對(duì)于同一問(wèn)題,用戶如果認(rèn)為文心一言回答不準(zhǔn)確,可以點(diǎn)擊左下方的“重新生成”,當(dāng)前最多支持5次重新回答。文心一言會(huì)提供“本次回答相較上次回答:更好、更差、差不多”的評(píng)價(jià)選項(xiàng),供用戶對(duì)于不同的回答進(jìn)行評(píng)價(jià)和反饋。

    記者通過(guò)多個(gè)問(wèn)題對(duì)文心一言進(jìn)行了測(cè)試。在“濟(jì)南一日游規(guī)劃”中,文心一言給出了千佛山、大明湖、珍珠泉、美食街、山東省博物館等景點(diǎn)推薦,并根據(jù)這幾個(gè)景點(diǎn)的實(shí)際位置分布,給出了比較合理的游覽路線規(guī)劃。

    3歲孩子叛逆如何教育

    對(duì)于“3歲孩子叛逆,怎么教育?”的問(wèn)題,文心一言從“給予安全感、建立良好的溝通方式、設(shè)立明確的規(guī)則和限制、培養(yǎng)孩子的自我控制能力、給予正面激勵(lì)”等5個(gè)方面給出了較為合理的建議,并總結(jié)“根據(jù)孩子的具體情況,采取適當(dāng)?shù)慕逃椒ǎ瑤椭⒆涌朔涯媲榫w,健康成長(zhǎng)”。

    但在回答“泰山是濟(jì)南哪里的景點(diǎn)?”這一問(wèn)題時(shí),文心一言并未糾正提問(wèn)中的錯(cuò)誤,而是先在第一段順著用戶的說(shuō)法回答“泰山位于山東省濟(jì)南市泰安市,是濟(jì)南的著名景點(diǎn)之一”。在第二段的介紹中,文心一言又給出了正確的回答“泰山位于泰安市泰山區(qū)”。除了第一段的錯(cuò)誤回答,回答中的其他信息都非常準(zhǔn)確、精煉。

    面對(duì)“寫一張請(qǐng)假條”的問(wèn)題,文心一言并未詢問(wèn)或讓用戶選擇是學(xué)校請(qǐng)假條還是公司請(qǐng)假條,而是直接給出了一張學(xué)生請(qǐng)假條。從內(nèi)容來(lái)看,這張請(qǐng)假條做到了用語(yǔ)禮貌、文字簡(jiǎn)潔、格式準(zhǔn)確、要素齊全,并給出了“我已安排好相關(guān)的學(xué)習(xí)計(jì)劃,并會(huì)盡快補(bǔ)上課堂上的內(nèi)容”的內(nèi)容,堪稱學(xué)生請(qǐng)假條的范本。

    記者提問(wèn)“用柱狀圖展示山東省各市GDP情況”,文心一言用柱狀圖畫出了青島、濟(jì)南、煙臺(tái)、濰坊、東營(yíng)、濱州6個(gè)市的2021年GDP統(tǒng)計(jì)數(shù)據(jù),并按數(shù)據(jù)大小分別排列,但未完整展示山東省16市的GDP情況。

    左圖為今年3月文心一言測(cè)試階段畫圖,右圖為8月31日文心一言畫的圖

    隨后,記者用文心一言畫了幾幅圖。在“畫一個(gè)夫妻肺片”的問(wèn)題中,文心一言相對(duì)準(zhǔn)確的畫出了5張“一盤切成片的中式?jīng)霾恕保⒂欣苯贰⑾悴四⑨u汁等元素。就在今年3月份剛推出測(cè)試版時(shí),面對(duì)這個(gè)問(wèn)題,文心一言給出的答案還是在夫妻二人的卡通圖片畫上未知?jiǎng)游锏姆巍S纱丝梢?jiàn),文心一言已經(jīng)根據(jù)用戶反饋和數(shù)據(jù)訓(xùn)練,做出了更為精準(zhǔn)的回答。

    然而面對(duì)“畫一個(gè)老婆餅”的問(wèn)題,文心一言給出的5張圖片中,有3張是將“老婆”和餅這兩種元素融合在了一張圖片中,另外2張只畫了餅。

    專業(yè)學(xué)者:寬容對(duì)待大模型高質(zhì)量的大數(shù)據(jù)訓(xùn)練將使它超乎人類想象

    根據(jù)網(wǎng)友們反饋的問(wèn)答結(jié)果,有業(yè)內(nèi)人士總結(jié)稱,目前文心一言的缺點(diǎn)之一是語(yǔ)義理解能力有限,在處理一些語(yǔ)義模糊或不確定的文本時(shí),可能會(huì)出現(xiàn)理解偏差或誤判。這主要是由于語(yǔ)言本身的復(fù)雜性和多樣性,以及模型在學(xué)習(xí)過(guò)程中可能存在的數(shù)據(jù)偏差或模型參數(shù)優(yōu)化不足等問(wèn)題。

    “其實(shí)如果只是看‘老婆’、‘餅’,文心一言已經(jīng)做的不錯(cuò)了,關(guān)鍵是大模型還沒(méi)有人那么強(qiáng)的語(yǔ)義理解能力。”齊魯工業(yè)大學(xué)(山東省科學(xué)院)計(jì)算機(jī)科學(xué)與技術(shù)系鹿文鵬教授分析稱,AI大模型在畫圖時(shí)擅長(zhǎng)分析用戶要求里的關(guān)鍵字并進(jìn)行體現(xiàn),而對(duì)一些比較高深、需要意會(huì)的內(nèi)容,目前它理解起來(lái)還是有一定困難的。

    鹿文鵬教授分析稱,人工智能大模型都是通過(guò)大量數(shù)據(jù)“喂”出來(lái)的,目前訓(xùn)練大模型從技術(shù)上來(lái)講難度不大,但關(guān)鍵還是要靠高質(zhì)量的數(shù)據(jù)。“它不可能剛開(kāi)始就很完美,但它的學(xué)習(xí)能力很強(qiáng),有人類的反饋進(jìn)步改善會(huì)非常快。當(dāng)模型的(數(shù)據(jù)量)大到一定程度時(shí),就會(huì)發(fā)現(xiàn)它的能力比我們想象的要強(qiáng)很多。”

    同時(shí),對(duì)于“泰山是濟(jì)南哪里的景點(diǎn)?”這類故意誘導(dǎo)的問(wèn)題,鹿文鵬教授分析認(rèn)為,面對(duì)這種可能引起歧義的問(wèn)題,大模型的理解能力會(huì)相對(duì)弱一些,無(wú)法準(zhǔn)確把握用戶的意圖,有時(shí)也會(huì)在用戶的故意誘導(dǎo)下說(shuō)一些不準(zhǔn)確的話。

    因此,鹿文鵬建議用戶對(duì)大模型要有一定的包容性。他類比稱,如果把“泰山是濟(jì)南哪里的景點(diǎn)?”“畫一個(gè)老婆餅”這類問(wèn)題拿給人類的小朋友,他們也不知道什么意思,也很可能也會(huì)畫錯(cuò)、說(shuō)錯(cuò)。

    “類似地也可以理解為大模型正處于幼兒階段,后期會(huì)有越來(lái)越多的人教它,它是會(huì)學(xué)習(xí)的,后面肯定會(huì)進(jìn)化。(老婆餅之類的問(wèn)題)現(xiàn)在可能不行,到下個(gè)月估計(jì)就畫得很好了。”鹿文鵬稱。

    “現(xiàn)在我就用一些AI大模型去幫助批改學(xué)生論文,它在檢查、文字校對(duì)方面做得非常好,可以幫助減輕一些負(fù)擔(dān),但最后肯定要由人去把關(guān)。”鹿文鵬觀察認(rèn)為,在實(shí)際應(yīng)用領(lǐng)域,文字、圖像、設(shè)計(jì)、編程等領(lǐng)域的工作者把文新一言、ChatGPT等當(dāng)成輔助工具是非常好的。

    他舉例稱,目前讓這些大模型寫個(gè)摘要、會(huì)議日程、發(fā)言稿等,它們都能做得很好;設(shè)計(jì)工作者通過(guò)給出一個(gè)設(shè)計(jì)草圖,AI軟件就能生成一批類似的圖供挑選,不需要再自己絞盡腦汁地一張張?jiān)O(shè)計(jì),其中有些圖甚至能超過(guò)人的創(chuàng)意。

    鹿文鵬分析,AI大模型的未來(lái)應(yīng)用前景很廣。目前大模型正往多模態(tài)、垂直領(lǐng)域等方向發(fā)展。一方面,它從簡(jiǎn)單的文字交互發(fā)展到圖片、數(shù)據(jù)圖等更多模態(tài),另一方面,在政務(wù)自動(dòng)問(wèn)答服務(wù)、法律咨詢、醫(yī)療咨詢等特定領(lǐng)域,大模型也能做出一些相對(duì)精確的回答。

    (來(lái)源:海報(bào)新聞)

    關(guān)鍵詞:

    上一篇:新一輪存款降息,多家銀行已官宣下調(diào)存款利率,最大降幅25個(gè)基點(diǎn)
    下一篇:最后一頁(yè)

    亚洲娇小性xxxx| 国产精品亚洲产品一区二区三区| 亚洲综合无码AV一区二区 | 亚洲日本中文字幕天天更新| 亚洲一级毛片中文字幕| 国产AV无码专区亚洲AV手机麻豆| 亚洲裸男gv网站| 亚洲国产精品成人| 亚洲AV日韩精品一区二区三区| 久久久久久久久无码精品亚洲日韩| 亚洲精品精华液一区二区| 亚洲性无码一区二区三区| 亚洲人成色在线观看| 亚洲AV永久无码精品一福利| 久久久久亚洲国产AV麻豆| 自拍偷自拍亚洲精品播放| 午夜亚洲福利在线老司机| 亚洲第一区在线观看| 久久亚洲精品无码观看不卡| 中文字幕精品亚洲无线码二区| 亚洲色自偷自拍另类小说| 国产精一品亚洲二区在线播放| 久久精品国产亚洲综合色| 亚洲AV福利天堂一区二区三| 亚洲天堂在线播放| 亚洲精品在线播放视频| 亚洲一卡二卡三卡| 亚洲人成网站18禁止| 久久无码av亚洲精品色午夜| 亚洲成?Ⅴ人在线观看无码| 最新国产AV无码专区亚洲| 亚洲爆乳精品无码一区二区三区| 亚洲av无码av制服另类专区| 91嫩草私人成人亚洲影院| 亚洲一卡二卡三卡| 亚洲av无码av在线播放| 久久精品国产精品亚洲人人| 亚洲va无码va在线va天堂| 337p日本欧洲亚洲大胆精品555588| 亚洲人成在线播放| 亚洲欧美中文日韩视频|