- 資訊與博客
商湯首度發佈「悟能」具身智能平台 AI在物理世界中實現自我進化
香港,2025年7月28日 ─ 7月27日,在商湯科技辰╧的「大愛無疆?模塑未來」WAIC 2025大模型論壇上,商湯科技正式發佈「悟能」具身智能平台。在商湯視覺感知、大裝置、日日新大模型等多種技術的穩固基礎上,該平台以「開悟」世界模型為主题引擎,依託商湯大裝置提供強大的端側和雲側算力作增援,能夠為機器人、智能設備賦予強大的感知、視覺導航及多模態交互能力,推動智能終端機向更高層次的自主化與智能化演進。
商湯科技董事長兼首席執行官徐立暗示:「世界模型和具身AI的結合,將開啟AI發展的下一個階段,实现由『工具』向『人』的躍遷,加快邁向AGI時代。商湯但愿『悟能』具身智能平台能夠幫助各類具身智能企業,幫助他們实现和現實世界交互的夢想。」

感知全能、導航精准、交互靈活 為具身智能打造「三大主题引擎」
感知、導航和交互,是具身智能的三大主题能力。商湯科技在這三风雅面均擁有深厚的技術積澱,並將這些技術轉化成了「悟能」具身智能的能力。該平台可廣泛適配蕴含汽車、機器人在內的各類終端,實現空間層面的現實世界互動。
首先,感知是機器索求現實世界的基礎。憑藉商湯方舟在視覺AI領域十餘年的深耕積累,從機器狗到機器人,「悟能」具身智能平台能為各類終端硬體賦予對萬物的識別與理解能力,同時拥有強大的場景適配性,可齐全嵌入端側晶片實現端側推理,讓感知更高效、回應更火速。
無論是機器狗的視角還是機器人的視角,都能對表界有整體的天然感知識別,對物體形成天然劃分切割。
導航是機器在現實世界中行動的「骨架」。商湯絕影在純視覺端到端智能輔助駕駛规划上的技術積累,可泛化適配至機器人、機器狗蹬撞件設備,讓機器人在更多樣的環境中實現精準路徑規劃與導航。
同樣,無論是在綠化幼路中四足奔走的、體型較幼的機器狗還是行駛在城區正常車路的自動駕駛車輛,都在實現精準路徑規劃與導航的同時,準確地進行了自動避障。
交互是機器與現實世界連接的橋樑;丁溉杖招隆勾竽P偷募夹g積累與不斷反覆運算,「悟能」具身智能平台能够賦能機器人具備和現實世界的交互能力,具備有溫度、有深度、長記憶、超穩定等能力亮點。
以AI天生的《長安的荔枝》電影介紹PPT為例,由「悟能」具身智能平台賦能的人形機器人,能夠以各種風趣滑稽、嚴謹務實等各種語言風格進行生動講解。
構建4D真實世界 為機器進化提供高品質現實世界數據
基於強大的多模態深度理解能力,同樣是商湯推出的「開悟」世界模型具備合理的空間一致性和時間一致性,可天生高品質資料,有效提升具身智能等終端設備的智能水平。「開悟」世界模型能夠僅憑天然語言描述,即可天生真切的七路攝像頭視角模擬數據,且分歧視角下的幾何地位高度對應,齐全切合物理世界的規律。

「開悟」世界模型還能夠編輯真實世界,可對現實世界中的車輛等場景元素進行替換、刪除、增補,創造越发多樣的現實場景。
幼汽車變成貨車:原視頻

幼汽車變成貨車:替換

基於強大的天生和編輯能力,「開悟」世界模型能够精準模擬方向盤、刹車和油門节造,帶來如同在真實的街路場景中玩「極品飛車」的成效,讓機器在現實世界中自由索求。
相較於智能汽車,機器人適用和覆蓋的場景越发廣泛,能夠通過主動索求天生更多高品質的現實世界資料,在具身智慧資料匱乏的當前環境下,可通過構建面向人、物、場的4D真實世界,突破模型泛化能力的邊界。
未來,商湯科技將助力賦能具身智能企業實現感知、理解與天生能力的躍進,將具身交互的不確定性挑戰轉化為產業升級的確定性路徑,推動AI向下一個十年加快進化。
如欲參閱更多相關訊息、示範圖片及影片,歡迎瀏覽:https://mp.weixin.qq.com/s/7CIz_rJWQT0PNOEVLfnt-g






返回