π0測試結果

3_20251204122700.jpg

  π0.5測試結果

  相比之下,自變量的wall-oss-flow 在相同條件下的表現明顯偏弱。測評結果顯示:wall-oss-flow共測試31次,其中2次成功率為60%,1次成功率為50%,1次成功率為20%,其余所有任務成功率均為0。

4_20251204122309.jpg

  wall-oss-flow測試結果

  “具身進化論”從進度分情況看到,模型雖然在部分任務中能完成初段動作,但多數情況下未能完成關鍵步驟,執行鏈條往往在中段被迫中斷。這與平臺強調的“多階段連續操作能力”形成明顯差距。

  公開信息顯示,自變量2023年成立,創始人兼CEO為王潛。今年9月,自變量發布其開源大模型WALL-OSS,自變量在官方宣傳稿中強調該模型“具備強大的泛化性和推理能力,在長程操作任務方面表現優于其他基礎模型”。

  王潛甚至曾在接受媒體采訪時表示:“我們(自變量)的模型水平基本上和PI、和google在同一個水平線上。”

  但此次RoboChallenge 的評測結果顯示,自變量模型的水平、能力在真實機器人執行任務時未能體現,與PI的模型(π0 和 π0.5)也存在明顯差距。

  一位具身智能從業者對“具身進化論”分析,RoboChallenge的獨特價值正是在于提供透明、可復現的真機評估環境,避免主觀展示帶來的偏差。隨著越來越多模型加入測評,業內對“模型真實能力差異”有了更清晰的認知。

  對具身智能行業而言,此次結果再次提醒:真正的競爭不在PR宣傳中,而在三方認可的評測,學術基準線,以及機器人能否穩定完成任務的那一刻。

  真實世界,正在成為檢驗大模型能力的最終標準。而認識到差距,正是追趕的開始。

中文科技資訊微信二維碼logo

  文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

海報生成中...

[No.H002]
瀏覽

最新新聞

熱門新聞

即時

全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

新聞

市場占比高達35.8%,阿里云引領中國AI云增長

9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

3C消費

雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

研究

IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院
| | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | |