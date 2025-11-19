機器人在北京國家速滑館“冰絲帶”舉行的2025世界人形機器人運動會開幕式上進行100米賽跑（圖片來源：新華社） 中評社北京11月19日電／新華社刊發《瞭望》新聞周刊文章，以下為文章內容。



從央視春晚上宇樹機器人“扭秧歌”開始，中國具身智能正以驚人速度成長，跑馬拉鬆、打拳擊、踢足球、跳街舞，還可以在汽車工廠“上崗”……每一個“驚人”的技能都在凸顯這個行業的發展新高度。



“這些花樣玩活的視頻放出來，把大家的胃口吊起來了，容易讓人誤判形勢，以為機器人已經高度成熟，可以做很多高難度事情，就快上天入地、無所不能了。”一位工業機器人企業高管感嘆，我們需要透過“表面繁榮”，看到具身智能的實際能力。



細心的人會發現，幾乎所有做高難度動作的機器人身旁，都有一位人類工程師在遙操，或者機器人提前植入了程序，也就是說，這些機器人還是“提線木偶”，需要人類“把著手”做事。



具身智能何時才能擺脫遙控器，距離“全自主”還有多遠？



大腦“進化”



突破遙操的關鍵是要具備強大大腦，即機器能夠理解物理世界並與之交互，實現感知—決策—執行—反饋的閉環。以自動駕駛領域為例，VLA大模型（視覺—語言—行動模型）、端到端強化學習和世界模型是三類核心技術要素，三者協同實現機器從感知環境到執行動作的自主智能。



VLA大模型融合視覺、語言和動作三種模態，用於讓機器人理解環境、接受指令並執行物理動作，是具身智能基礎模型。今年6月銀河通用發布了面向零售場景的大模型GroceryVLA，實現機器人對複雜環境的自主決策與精準執行，例如當人類發出“幫我拿點吃的”指令後，機器人無需遙操作，無事先采集場景數據，通過自主規劃路徑，從貨架中識別並抓取餅幹飲料送達。

