突破核心技術　做強語音產業

【大中小】【打印】

	突破核心技術　做強語音產業
	http://www.CRNTT.com 2022-01-05 09:45:53

來源：人民日報

　　中評社北京1月5日電／據人民日報報道，“你好，歡迎來到北京冬奧會。”

　　話音剛落，便被轉換為英語、法語、日語等多種語言依次播報。走進北京冬奧小屋，一位名叫“愛加”的虛擬主播已正式上崗，在智能語音識別技術的支持下，可將普通話實時翻譯成全世界多個語種，讓奧運聲音更快傳遍全球。

　　不只是虛擬主播，與試衣鏡融為一體的AI（人工智能）私教、幫助快遞小哥快速收派件的智能穿戴設備、能“聽懂”語音自行打字上網的鼠標……如今，越來越多智能語音技術從實驗室走向終端應用，走進並服務人們的日常生活。

　　“作為軟件產業的重要組成部分，智能語音產業已步入快速發展的新階段。”在日前舉行的中國智能語音產業發展高峰論壇上，工信部信息技術發展司副司長王建偉介紹，近年來我國智能語音產業蓬勃發展，核心技術有所突破，目前語音識別準確率已達到98%。

　　最新發布的《2020—2021中國語音產業發展白皮書》（以下簡稱《白皮書》）顯示，2020年我國智能語音市場規模達到217億元，同比增長31%，2021年可達到285億元，同比增長44%，有力帶動產業數字化發展。“進入萬物互聯時代，越來越多的智能設備需要在一定距離外操控，為智能語音產業帶來發展機遇。”中國語音產業聯盟理事長、科大訊飛董事長劉慶峰介紹，語音交互賦能的智能設備正快速增長，以科大訊飛為例，2021年語音助手交互量同比增加84%。

　　隨著我國智能語音產業進入規模化深耕期，如何加速關鍵技術研發和產業化，推動產業持續做大做強，成為業界普遍關注的問題。

　　“當下，智能語音技術發展面臨多語種語言互通、複雜場景人機交互和多模態虛擬世界三大挑戰。”劉慶峰分析，多語種不僅指國外語言也包括國內方言；複雜場景就是要在高噪音多人說話場景下做到精准識別，今年訊飛產品識別率有望從69%提升至80%；多模態交互，就是要在語音中加入音色、語氣、表情、嘴型等因素，讓感知更智能。

　　《白皮書》指出，智能語音未來發展的關鍵創新點，是無監督學習、多模態融合、腦科學交叉融合創新等。目前在算法上，無監督學習、低資源模型算法等需要突破。此外，作為算力基礎的AI芯片領域，我國與國際先進水平仍存在差距。

　　推動智能語音產業高質量發展，下一步工信部將開展三方面工作。王建偉介紹，一是鼓勵地方加快制定有利於促進智能語音技術與實體經濟融合發展的產業政策。二是鼓勵龍頭企業、科研機構聯合開展技術攻關，進一步提升語音識別、合成、交互和語音芯片等技術水平，並建設國家級檢驗檢測等公共服務平台，為產業發展提供有力支撐。目前，中國語音產業聯盟已吸引70多家產業鏈上下游擁有核心技術的企業，未來還將再增加70家相關企業，並鼓勵更多科研院校加入聯盟。三是不斷拓展應用場景，加速語音技術在智能製造、智能家居、智慧醫療、教育養老等領域的融合應用。

【大中小】【打印】掃描二維碼訪問中評社微信