】 【打 印】 
【 第1頁 第2頁 第3頁 】 
2027初步建“國家關鍵語料庫”
http://www.CRNTT.com   2025-05-26 10:42:10


  中評社北京5月26日電/據中國青年報報導,“當前,隨著新一輪科技革命和產業變革,大語言模型、人工智能技術快速發展,語料庫的建設規模與應用範圍也經歷了大幅度完善和拓展。”前不久,教育部語言文字信息管理司相關負責人提到,決定實施國家關鍵語料庫共建共享計劃,擴展關鍵領域,支持共建共享,推進應用轉化,為全方位釋放語言文字在經濟社會發展中的數據要素價值奠定更加寬厚基礎。

  近期,教育部、國家語委、中央網信辦印發《關於加強數字中文建設 推進語言文字信息化發展的意見》(以下簡稱《意見》)。其中提到,到2027年,國家數字中文建設行動取得重要成效,語言文字數據要素價值有效釋放。基本形成“政府主導、部門協同、社會參與、共建共享”的語言文字信息化工作機制;基本建成國家語言文字大數據中心,初步建成國家關鍵語料庫和國家戰略語言資源信息庫;語言文字信息化標準、前沿語言技術、優質語言資源、新型語言服務等基礎支撐能力顯著增強。

  “國家關鍵語料庫”是什麼

  《意見》提出,推動基礎性語言資源建設,實施國家關鍵語料庫共建共享計劃,重點支持建設大規模中文語料庫及高質量民族語言文字語料庫、手語盲文語料庫、行業領域語料庫、語言監測動態語料庫等。

  教育部語言文字信息管理司相關負責人在接受中青報·中青網記者專訪時提到,語料庫是自然語言處理、大語言模型、人工智能技術創新應用的重要支撐,是經濟社會信息化建設、數字化賦能和智能化發展的基礎要素,促進語言數據賦能信息技術創新與信息技術賦能語言文字資源使用的雙向賦能。

  以文化傳承領域為例,目前已經建設了中華思想文化術語庫、中華精品字庫、甲骨文數據庫、中國語言資源保護數據庫等。

  其中,中華思想文化術語庫包括了中華民族所創造或構建,凝聚、濃縮了中華哲學思想、人文精神、思維方式、價值觀念,以詞或短語形式固化的概念和核心詞。該語料庫中包括1200餘條思想文化術語、中醫文化關鍵詞、典籍譯本、典籍譯名、博雅雙語詞等。 


【 第1頁 第2頁 第3頁 】 


掃描二維碼訪問中評網移動版 】 【打 印掃描二維碼訪問中評社微信  

 相關新聞: