|
| 機器人在北京國家速滑館“冰絲帶”舉行的2025世界人形機器人運動會開幕式上進行100米賽跑(圖片來源:新華社) |
中評社北京11月19日電/新華社刊發《瞭望》新聞周刊文章,以下為文章內容。
從央視春晚上宇樹機器人“扭秧歌”開始,中國具身智能正以驚人速度成長,跑馬拉鬆、打拳擊、踢足球、跳街舞,還可以在汽車工廠“上崗”……每一個“驚人”的技能都在凸顯這個行業的發展新高度。
“這些花樣玩活的視頻放出來,把大家的胃口吊起來了,容易讓人誤判形勢,以為機器人已經高度成熟,可以做很多高難度事情,就快上天入地、無所不能了。”一位工業機器人企業高管感嘆,我們需要透過“表面繁榮”,看到具身智能的實際能力。
細心的人會發現,幾乎所有做高難度動作的機器人身旁,都有一位人類工程師在遙操,或者機器人提前植入了程序,也就是說,這些機器人還是“提線木偶”,需要人類“把著手”做事。
具身智能何時才能擺脫遙控器,距離“全自主”還有多遠?
大腦“進化”
突破遙操的關鍵是要具備強大大腦,即機器能夠理解物理世界並與之交互,實現感知—決策—執行—反饋的閉環。以自動駕駛領域為例,VLA大模型(視覺—語言—行動模型)、端到端強化學習和世界模型是三類核心技術要素,三者協同實現機器從感知環境到執行動作的自主智能。
VLA大模型融合視覺、語言和動作三種模態,用於讓機器人理解環境、接受指令並執行物理動作,是具身智能基礎模型。今年6月銀河通用發布了面向零售場景的大模型GroceryVLA,實現機器人對複雜環境的自主決策與精準執行,例如當人類發出“幫我拿點吃的”指令後,機器人無需遙操作,無事先采集場景數據,通過自主規劃路徑,從貨架中識別並抓取餅幹飲料送達。
|