寫稿能“查重” 西湖大學(xué)團(tuán)隊(duì)研發(fā)AI生成文本檢測(cè)模型
中新網(wǎng)杭州3月13日電(林波 曹丹)“你的稿子是不是由AI創(chuàng)作的,通過(guò)我們的大模型就可以判斷出來(lái)?!苯?,西湖大學(xué)終身教授、自然語(yǔ)言處理實(shí)驗(yàn)室負(fù)責(zé)人張?jiān)澜邮?a target='_blank' href='/' >中新網(wǎng)專訪時(shí)表示,在人工智能大模型應(yīng)用熱潮下,他們團(tuán)隊(duì)設(shè)計(jì)了一種“無(wú)監(jiān)督算法”,將實(shí)現(xiàn)開放領(lǐng)域的AI生成文本檢測(cè)。

隨著科技創(chuàng)新的不斷推進(jìn),AI正成為新生創(chuàng)作力量。
張?jiān)酪苍囍貌煌娜斯ぶ悄艽竽P退阉鞑⒄聿糠止ぷ魉夭?,這之中他也時(shí)常遇到“AI幻覺”問題,“我需要一篇文獻(xiàn),在搜索時(shí),AI給出了相關(guān)推薦,里面標(biāo)注了作者、標(biāo)題,甚至是摘要,但當(dāng)我上網(wǎng)查找時(shí),卻發(fā)現(xiàn)文章并不存在,這就是典型的幻覺問題”。
這種“虛構(gòu)”現(xiàn)象被稱為“AI幻覺”,即AI在遇到不熟悉或超出其知識(shí)范圍的問題時(shí),會(huì)編造出難以辨明真假的細(xì)節(jié),生成與事實(shí)相悖的答案。
這也是近期用戶與大模型交互時(shí)可能遇到的問題。
張?jiān)雷⒁獾剑诮逃I(lǐng)域,若本科生的畢業(yè)設(shè)計(jì)大量使用AI撰寫,可能會(huì)出現(xiàn)“AI幻覺”問題,引用不存在的參考文獻(xiàn),“這不僅無(wú)法真實(shí)反映學(xué)生的水平,還會(huì)傳播錯(cuò)誤知識(shí)”。
而在新聞?lì)I(lǐng)域,如果AI生成的虛假新聞被發(fā)表,可能對(duì)輿情造成負(fù)面影響。
“因此,檢測(cè)文本是否由AI生成至關(guān)重要?!睆?jiān)澜忉尩溃绾未_保AI生成內(nèi)容的可控性,首先需要解決一個(gè)基礎(chǔ)問題——準(zhǔn)確判斷一個(gè)文本是否由AI撰寫,這被稱為AI生成文本的自動(dòng)檢測(cè)。
如何對(duì)AI生成文本進(jìn)行檢測(cè)?
在張?jiān)揽磥?lái),傳統(tǒng)方法,如有監(jiān)督的機(jī)器學(xué)習(xí)算法,存在顯著局限。它們依賴于收集的人寫和機(jī)器寫的訓(xùn)練數(shù)據(jù),但只能準(zhǔn)確判斷訓(xùn)練數(shù)據(jù)中包含的模型或領(lǐng)域文本。對(duì)于新的模型或領(lǐng)域,如生物醫(yī)藥論文,其性能會(huì)大幅下降。
為了克服這一局限,張?jiān)缊F(tuán)隊(duì)研究并設(shè)計(jì)了一種無(wú)監(jiān)督的算法模型。
無(wú)監(jiān)督算法是機(jī)器學(xué)習(xí)中的一種方法,它不需要預(yù)先標(biāo)記的數(shù)據(jù),而是通過(guò)算法自動(dòng)發(fā)現(xiàn)數(shù)據(jù)中的模式、結(jié)構(gòu)和關(guān)聯(lián)。
張?jiān)勒f(shuō):“AI在遣詞造句時(shí),會(huì)根據(jù)已出現(xiàn)的詞匯選擇概率較高或經(jīng)驗(yàn)風(fēng)險(xiǎn)較低的詞。而人類則先確定想表達(dá)的內(nèi)容,再將其翻譯成句子,不受統(tǒng)計(jì)分布的限制?!?/p>
利用這一本質(zhì)差別,這一研發(fā)模型可以對(duì)任何文本進(jìn)行概率判斷和估算,從而判斷其是否由AI撰寫。
目前,張?jiān)缊F(tuán)隊(duì)已經(jīng)展示了Demo版本,并吸引了大量用戶。同時(shí),他們也在與一些實(shí)際應(yīng)用場(chǎng)景合作,進(jìn)行簡(jiǎn)單部署。
“請(qǐng)寫一篇描寫西湖的文章。”在現(xiàn)場(chǎng),張?jiān)缊F(tuán)隊(duì)成員鮑光勝在一個(gè)人工智能大模型中輸入了這個(gè)請(qǐng)求。在生成文本后,他將內(nèi)容拷貝在Demo版本的應(yīng)用中。作者注意到“AI創(chuàng)作率”結(jié)果顯示為“90%”。
未來(lái),隨著該模型的推廣,它將有助于解決教育領(lǐng)域、新聞?lì)I(lǐng)域等實(shí)際問題。(完)


社會(huì)新聞精選:
- 2025年04月09日 17:37:07
- 2025年04月09日 14:52:09
- 2025年04月09日 13:20:55
- 2025年04月09日 13:12:47
- 2025年04月09日 11:49:33