來源:新華每日電訊 發(fā)布時(shí)間:2025-10-27 13:15
如今越來越多人使用人工智能助手獲取新聞。然而,歐洲廣播聯(lián)盟22日發(fā)布的一項(xiàng)研究顯示,被問及新聞事件時(shí),當(dāng)下歐美地區(qū)廣泛使用的人工智能助手給出的回答約半數(shù)有錯(cuò)。研究人員提醒民眾,現(xiàn)階段人工智能助手還不是獲取新聞的可靠渠道,同時(shí)敦促相關(guān)人工智能企業(yè)承擔(dān)相應(yīng)責(zé)任予以改進(jìn)。
這項(xiàng)研究的對象是4家歐美地區(qū)常用的人工智能助手:美國開放人工智能研究中心開發(fā)的ChatGPT、微軟公司的Copilot、谷歌的Gemini和“解惑”人工智能公司的“解惑”(Perplexity)。
5月底至6月初,美國、英國、法國、德國和西班牙等18個(gè)國家和地區(qū)的22家公共媒體用14種語言向上述人工智能助手提出同樣的新聞問題,評估它們在新聞準(zhǔn)確性、來源和區(qū)分觀點(diǎn)與事實(shí)的能力等方面的表現(xiàn)。分析結(jié)果顯示,在上述助手給出的3000個(gè)回答中,45%存在至少一個(gè)重大錯(cuò)誤,81%或多或少存在問題,比如將新聞與惡搞混淆,弄錯(cuò)日期,甚至虛構(gòu)事件等。
新聞來源和準(zhǔn)確性是最常見的問題。三分之一的回答引用的來源存在嚴(yán)重問題,如來源缺失、誤導(dǎo)或不正確;20%的回答“存在嚴(yán)重的準(zhǔn)確性問題,包括虛構(gòu)細(xì)節(jié)和信息過時(shí)”。
就新聞來源而言,Gemini錯(cuò)誤率尤其高,超過七成。相比之下,其他三個(gè)人工智能助手的錯(cuò)誤率均低于25%。
歐洲廣播聯(lián)盟副總干事讓·菲利普·德滕德爾說,人工智能助手“還不是獲取新聞的可靠方式”。然而,當(dāng)下它正逐漸取代搜索引擎,成為獲取新聞的主要渠道,如不改進(jìn),可能有損公信力。
依據(jù)路透社新聞研究所6月發(fā)布的《2025年數(shù)字新聞報(bào)告》,約7%的在線新聞消費(fèi)者和15%的25歲以下人群使用人工智能助手獲取新聞。(王鑫方 新華社專特稿)