“當視覺數據跟觸覺數據加在一起,要考慮的有效數據元素過多,模型體量增大,難度也必然提升。”他山科技CEO、聯合創始人馬揚舉例,他山科技正在研究機器人剝小龍蝦任務,這種看似非常簡單的精細動作,實則需要大量的訓練和學習。“我們目前在武漢招募了十幾個人的團隊做小龍蝦項目,計劃今年底完成模型訓練,並推進小批量試驗。”
硬件方面,具身智能本體端部署的大模型,對算力水平要求高,專用芯片仍不夠成熟。“需要加速發展低功耗、高性能且專用於具身智能大模型的芯片;同時將大參數模型輕量化、小型化,並保證在執行任務時性能不會大幅下降。”一位高校具身智能專家提出。
算法層面,業界仍難以訓練出強泛化能力的大模型。中國信息通信研究院人工智能所安全與具身智能部副主任張蔚敏介紹,在3D場景中的情景問答(SQA3D)任務中,當前最先進的模型準確率已提升至55%~60%區間,但仍遠低於人類的90.06%,這表明算法成熟度不夠高。
此外,目前探討的具身智能多為單體智能,在實際應用中,多台機器人協同工作的群體智能,亦是行業需要攻克的課題。
不可否認,具身智能產業飛速發展,泛化能力正越來越強大。“部分場景樂觀估計三五年就能在技術上實現突破。”趙明國表示。
分級分類加快落地
加速實現通用智能,僅靠實驗室環境無法模擬複雜場景的動態不確定性,需要在真實落地場景中暴露問題並找到解決方案。“具身智能需要一個標準分層,有標準就可以實現技術對齊,加速產品落地。”瑞銀證券中國工業分析師王斐麗說。
目前,國內一些行業機構效仿智能駕駛分級標準,提出了具身智能相關分級框架,以加快技術進步和場景落地。
|