|
“中研院”長廖俊智接受質詢。(中評社 俞敦平攝) |
葛如鈞進一步指出,日本在AI訓練上針對版權內容的處理方法,是採取全面開放版權的手段,意圖透過這種與歐美不同較為激進的方式,讓在AI領域起步較晚的日本能急起直追。他詢問廖俊智對此事的看法,並問他是否會為了讓也是處於落後的繁體中文追上採取類似激進的手段。廖俊智同意這是一個前瞻的做法,並表示需要深入研究其利弊。
接著葛如鈞提到了“中研院”釋出以Llama 2開發的繁中優化大型語言模型所引起的爭議,當時因為參考資料大量使用網路上較為豐富的簡體中文內容,因此該模組生成了許多爭議性的內容,事後“中研院”因此成立的AI風險研究小組。他強調了在AI學習過程中會面臨眾多挑戰,並呼籲“中研院”不要因為一次的失誤就停止前進,他詢問風險小組的近況。“中研院”智財技轉處的代表邱文聰,提到了風險小組已經有了進度報告,並且標示出可能的風險來源,詳細資料會書面交給葛如鈞。
最後,葛如鈞鼓勵“中研院”在AI技術的開放上採取更開放和開源的合作精神,並提到了臉書用戶自發性開設了繁體中文內容的開源社團。他認為,建立一個大型的繁體中文語言資料庫是迫切且重要的,並且應該由政府、企業和民眾共同努力。他讚揚了“中研院”資訊所廖弘源所長領銜的YOLO演算法,並期待“中研院”在AI語言模型推進上能夠帶領台灣走向更開放和前瞻的未來。 |