AIGC相對套路化的創作,可能會影響人類的用語習慣。“隨著越來越多人用AI創作或潤色文字,人類會受到潛移默化的影響,這或將影響整個社會對語言的使用。”鮑光勝說。
三種路徑識別文本
如何準確識別AI生成內容?鮑光勝介紹,目前主要有三種技術路徑進行檢測,分別是模型訓練分類器法(也被稱為監督分類器法)、零樣本分類器法、文本水印法。“三種檢測方法本質上都是利用AI檢測AI,且各有優劣。”鮑光勝說。
模型訓練分類器法,首先要收集大量人類創作內容與AIGC,然後以此為基礎訓練一個能區分兩類內容的分類器。“這是目前被廣泛使用的一種方法,但缺點較為明顯。”鮑光勝解釋,用於訓練分類器的數據有限,很難覆蓋所有類型和語言的文本。分類器在訓練數據覆蓋的文本領域或語言上檢測準確率較高,反之準確率則較低。而且,模型訓練往往需要較高成本,數據規模越大,訓練成本越高。
相比之下,零樣本分類器法不需要對機器進行訓練,也無需收集數據。它利用已訓練好的大模型,抽取語言模型生成文本的特徵,據此來區別人類與機器。“似然函數是零樣本檢測法中比較常用的基準之一,它可以簡單理解為一段文本在某個模型的建模分布中出現的概率。概率是一種特徵,不同的概率體現了人類創作內容與AIGC的差異。”鮑光勝進一步解釋,“零樣本分類通過綜合考慮多種函數特徵來區分人類創作內容與AIGC。”
如今,很多大語言模型幾乎覆蓋了互聯網上的全部數據。因此,相比於模型訓練分類器,零樣本分類器在不同領域、不同語言的文本上表現較為一致。
不過,零樣本分類器也存在明顯缺點。一方面,現有零樣本分類器依賴生成文本的源語言模型進行檢測,這意味著如果是未知源模型生成的文本,分類器就無法準確檢測。另一方面,為提高檢測準確率,零樣本分類器往往需要多次調用模型,這增加了模型的使用成本和計算時間。
“文本水印法則是一類‘主動方法’。區別於前兩類方法,它不是檢測已生成的文本,而是在AI生成文本時加入水印。人類雖然看不出這些水印,但卻能通過技術手段檢測出來。”鮑光勝說,文本水印法的準確率較高,但缺點在於水印可能被人為弱化甚至移除。此外,對於無法訪問模型內部結構的大語言模型,技術人員可能無法在生成內容時成功加入水印。
|