】 【打 印】 
阿里達摩院發布超大規模語言模型
http://www.CRNTT.com   2021-04-20 11:11:47


  中評社北京4月20日電/據新京報報道,4月19日,新京報貝殼財經記者獲悉,阿里巴巴達摩院發布超大規模語言模型PLUG,該模型參數規模達270億,參數上為目前全球規模最大的中文純文本預訓練語言模型,可進行小說續寫、詩歌生成等。

  4月19日,貝殼財經記者登錄該模型官網測試地址發現,其包括小說續寫、專業文稿撰寫、詩詞生成等功能。如輸入“人閑桂花落,夜靜春山空。月出驚山鳥,”後,AI自動續寫出了“林深聞杜鵑。誰家竹徑深,何處禪房幽。山光映疏影,水色接平波。”的詩句。

  據了解,近年來,大規模預訓練模型成為人工智能領域的重要趨勢。智源人工智能研究院院長黃鐵軍曾對記者表示近年來人工智能的發展已經從“大煉模型”逐步邁向了“練大模型”階段。而在預訓練模型上,去年5月,海外公司OpenAI發布能寫小說、聊天、編曲譜、寫代碼的GPT-3模型,將這一浪潮在全球範圍內推向新高。

  與GPT-3類似,阿里達摩院本次發布的PLUG模型有望廣泛應用於文本生成領域,成為“萬能寫作神器”,其目標是通過超大模型的能力,大幅提升中文自然語言技術在各類任務中的表現,取得超越人類表現的性能。

  據介紹,PLUG較GPT-3的改進之處在於,其集成了達摩院自研的語言理解及語言生成雙模型,並通過構建輸入文本雙向理解能力,提升了輸出文本的相關性。在語言理解任務上,PLUG以80.614分刷新了業內權威的中文語言理解評測基準CLUE分類榜單歷史紀錄。

  阿里巴巴達摩院語言技術實驗室負責人司羅表示,“達摩院團隊將進一步攻克自然語言處理領域科研難題,完善中文及跨語言人工智能基礎設施,讓AI沒有難懂的語言,並探索通用人工智能之路。”目前,PLUG採用了1TB以上中文文本訓練數據,涵蓋新聞、小說、詩歌、問答等廣泛類型及領域。接下來,PLUG將擴大參數規模至2000億級。

掃描二維碼訪問中評網移動版 】 【打 印掃描二維碼訪問中評社微信  

 相關新聞: