火熱的具身智能,藏著半個自動駕駛圈

自動駕駛用十年證明,在特定場景里“做到能用”比“看起來像人”更重要,具身智能正在重演這個真理。
2017年的自動駕駛,曾經相信終局會很快到來。
那一年,L4、L5被反復討論,無人駕駛出租車被視為觸手可及的未來。但十年過去,改變行業格局的并非最早承諾“無人駕駛”的公司,而是那些率先把輔助駕駛裝進量產車、跑通數據閉環的人。
今天的具身智能,站在相似的節點。
在剛剛結束的智源大會現場,人形機器人端咖啡、打乒乓球、做動態分揀吸引了眾多圍觀者,“機器人的ChatGPT時刻”也成為被頻繁討論的話題。

但在另一邊,越來越多從自動駕駛行業走出來的創業者,卻在談論如何找到第一個能夠穩定運行的場景,如何建立真實世界的數據閉環,以及如何讓機器人先“跑起來來,再變聰明”。
星源智創始人劉東把自動駕駛稱為“最簡單的具身”。在他看來,從二維空間里的避障導航,到三維空間里的物理交互,機器人面對的是比自動駕駛更復雜的問題。
具身智能是在復刻智駕的敘事節奏嗎?為什么從智駕過來的人成為行業變陣的關鍵變量,他們帶來的“漸進式落地”思路,會讓具身智能走出一條不同的路嗎?

當一個尚未到來的時刻成為行業圖騰
智源大會現場,銀河通用創始人兼CTO王鶴認為機器人的ChatGPT時刻,是指模型具備零樣本能力,無需專門學習即可在特定場景完成70%到80%的人類技能,且具備極高的可訪問性,初中畢業的人就能操作。
星源智創始人劉東則認為:“現在具身也是,大家瞄著實際應用的場景去做,但是L2能落地的也還不多,差不多是2015、2016年的智駕狀態,剛剛起步。”
2017年前后,自動駕駛行業同樣彌漫著類似的樂觀預期:L4級無人駕駛被普遍認為“三到五年量產”,但與此同時,真實的量產車里,連在高速上保持車道和自適應跟車都還在打磨。
無論是彼時的自動駕駛,還是今天的具身智能,都是“終局先于路徑被討論”,行業先形成了對于未來的集體想象,再回頭尋找通往未來的工程路線。
智源大會的現場,這種錯位以另一種形式呈現。人形機器人端咖啡、跟人類打乒乓球、在流水線上做動態分揀,這些Demo在展臺前圍滿了觀眾。

與此同時,星源智最新發布的ω-EVA模型在LIBERO上的成功率達到98.6%,在RoboTwin上的任務成功率從88.9%提升到90.3%。
數字很漂亮,但劉東在采訪時還是給出了相對冷靜的落地分層:純移動的巡檢、導覽已經比較成熟;抓放操作解決了90%的場景,但還有一些品類抓不好;至于酒店打掃、家庭服務等復雜操作,“短期落地還是比較困難”。
這并不意味著Demo沒有價值。恰恰相反,在一個新興技術領域,Demo是技術路線可行性的必要證明。
但需要區分的是,Demo證明的是“這件事在特定條件下可以做到”,而交付要求的是“這件事在多變條件下反復做到”。
這兩者之間的鴻溝,自動駕駛用了10年才走完。
奈何資本和產業端的熱情已經提前就位。智源研究院院長王仲遠提到,本屆大會匯聚了至少15家以上估值超過百億的具身智能CEO,“具身智能與人形機器人”是報名最火的論壇之一。
這讓人很難不聯想到2017年自動駕駛圈的“All in AI”,那時只要項目里有“自動駕駛”四個字,估值和曝光都會自動上一個臺階。
但現實的商業進度,未必跟上了敘事的節奏。星源智是少數能拿出具體落地案例的公司:叉車上的具身大腦、機器狗在開放場景里撿垃圾、物流場景里的自動化揀選。
劉東提到,這些合作是跟客戶“一事一議”談出來的,數據需要共享,場景需要定制。這不是那種“發布即通用”的敘事,而是先找到一個具體的場景,讓系統在里面跑起來,再談泛化。
所以,如果一定要在自動駕駛和具身智能之間畫一條線,可能不是敘事重疊,而是兩個行業在相似階段,面臨著同一種誘惑。

一代智駕人的“二次創業”
像劉東一樣有著自動駕駛背景的創始人,在具身智能領域不在少數。

自動駕駛解決了“讓車在平面上不撞東西”的問題,而具身智能要處理的是“讓設備在三維空間里與物體發生交互”。劉東把智駕比喻為最簡單的具身,“因為智駕當時做的時候,是在平面范圍內避開所有的物體,跟物體不發生交互。
現在具身領域,除了精確的導航行走之外,還要跟三維空間的物體進行交互。”
從“避開”到“拿起”,這個區別聽起來只是動作復雜度的增加,但在工程實現上,卻是一套完全不同的系統約束。
在自動駕駛里,攝像頭和激光雷達主要做環境感知和障礙物識別,決策鏈路相對清晰:看到、判斷、繞行。而在具身智能里,設備不僅要“看到”一個杯子,還要判斷“怎么拿”“拿起來會不會灑”“放下去的位置準不準”。
力控、觸覺、多模態同步,這些在自動駕駛里幾乎不存在的課題,在具身智能里成了日常功課。
所以,當這批從智駕過來的人進入具身領域時,他們帶來的不只是技術棧的遷移,還有一套已經跑過的產業記憶。
2017年的自動駕駛行業,曾經集體陷入“全棧自研”的誘惑,算法、硬件、數據、車輛,全部自己干。當時的邏輯是,只有閉環才能做出最好的體驗。但后來的產業現實證明,在銷量規模起來之前,全棧自研是一個極其昂貴的賭局。
在問及“頭部公司做全棧會不會影響你們”時,劉東的回答帶著這種經驗的痕跡:“在真正的銷量沒有起來之前,是沒有辦法支撐一個公司做全棧研發投入的,除非你已經大到像特斯拉這種規模,賬上根本不缺錢。”

他進一步判斷,市面上近兩百家具身公司里,真正有能力全棧閉環的“頂多就兩三家”,更多的公司會面臨一個選擇題:自己從頭研發大腦,還是從第三方采購?
自動駕駛行業最終證明,全棧自研的門檻極高,只有少數車企能夠負擔。因此行業逐漸分化:一部分資金和技術實力較強的新勢力選擇深度自研,而更多車企,包括部分傳統大廠和缺乏自研基因的新品牌,開始轉向與華為、Momenta、大疆、百度等供應商合作,或采取"部分模塊自研+核心算法外采"的折中路線。
劉東認為,具身智能領域也會呈現類似格局:“有些公司擅長做本體,有些公司擅長做模型,類似于我們以前看自動駕駛在整車行業的發展。”
基于這種判斷,星源智選擇了“不自己做本體”,外界曾把星源智比作“具身賽道的華為”,提供大腦模型和端側算力平臺,覆蓋市面上70%以上的頭部本體客戶。
這個選擇本身,很難說是因為2017年的“失敗教訓”,還是僅僅因為工程師們已經習慣了產業鏈分工的效率邏輯。但有一點是明確的:當一個團隊已經經歷過“什么都想自己做”的階段,他們在進入新戰場時,會更早地思考“什么應該讓別人做”。
除了商業模式的分化,從智駕過來的人還帶來了一套對“落地”的務實認知。
在自動駕駛領域,他們經歷過“云端算力還是車端算力”的路線之爭,知道控制時延對安全系統的意義。
這種經驗在具身智能里被重新激活:劉東在解釋為什么必須端側部署時,給出的不是技術偏好,而是物理約束,十幾個攝像頭加三個激光雷達,每秒數據量是幾個G,如果靠Wi-Fi或5G傳云端,“機器人已經撞上了,云端還在推理”。
所以,他們更早地接受了“端側閉環”的必然性,而不是把它當作一個可選項來討論。

具身智能難以“大力出奇跡”
回看自動駕駛發展歷程,曾經最受關注的是L5和Robotaxi,但率先進入交通系統的,是ADAS和L2+輔助駕駛。
它們沒有L5那么令人興奮,卻在不斷運行中積累數據、完善系統,讓自動駕駛擁有了繼續進化的土壤。
具身智能也在經歷類似的過程。家庭保姆機器人仍然遙遠,通用機器人大腦也尚未成熟,但叉車、機器狗、物流揀選等場景已經開始落地。它們未必最像人,卻最有機會率先跑通數據閉環。
如果說ADAS是自動駕駛通往L4的橋梁,那么今天的叉車和機器狗,就是具身智能通往AGI的橋梁。
劉東把落地難度分為三層,第一層是“純移動”:巡檢、導覽、導購,機器人只需要在空間里行走、識別目標、拍照記錄,不需要與物體發生復雜的物理交互。這一層已經比較成熟,星源智的機器狗在開放場景里撿垃圾、做清潔,就是這層的應用。
第二層是“抓放操作”,倉庫里的揀選、藥店的上下料、工廠里的簡單搬運。劉東坦承,這一層已經解決了90%的場景,但“還有一些品類是抓不好的,成功率也不高”。這10%的缺口,聽起來很小,但在真實商業環境里,可能就是客戶是否愿意簽單的關鍵。對應到2017年的自動駕駛,這很像“高速NOA”剛上線時的狀態:能跑,但還不敢讓用戶完全脫手。
第三層是“復雜操作”,酒店打掃、家庭服務、精細裝配。這些場景涉及多步驟任務鏈、非結構化環境、柔性物體的操作,劉東的判斷是“短期落地還是比較困難”。
這種“分層”既帶著從智駕移植過來的工程務實,也受限于具身智能的數據約束。星源智聯合創始人孫振國在采訪中提到,大語言模型可以從互聯網上免費獲取幾乎無限的語料,但具身智能沒有“互聯網級別的物理數據”。
各地政府牽頭建的數采廠,投入了大量機器人設備去采集動作數據,但采集到的數據量對于超大規模訓練來說,仍然遠遠不夠。大語言模型可以堆到幾百B甚至上千B的參數,而具身模型目前還在幾B、幾十B的規模徘徊。
這個瓶頸意味著,具身智能不可能像大語言模型那樣,通過“大力出奇跡”的方式一夜之間突破。它必須像自動駕駛一樣,在具體的場景里一圈一圈地跑,用真實的物理交互去喂養模型。
劉東在描述叉車的落地案例時,給出了一個很有說服力的細節:以前物流倉庫里也有自動化方案,但它們是“基于規則的”必須保證卡車停在準確的位置,貨物有準確的托盤,托盤有準確的形狀。
而具身大腦的價值在于,它可以“柔性地面對不同任務”,卡車大小不同、貨物形態各異、托盤可有可無,系統仍然能自主規劃卸貨邏輯,先卸什么后卸什么,避免碰撞和卸不干凈。
這種“柔性”,不是通過更大的模型一次性實現的,而是通過“特定場景的數據閉環”慢慢磨出來的。
星源智的叉車項目用了“兩個月左右”做出第一版系統,這個速度在具身智能領域算是很快,但劉東強調,他們復用了之前的算法基座,并且“完全端側部署”。
這也對應了劉東對未來格局的判斷:具身大腦公司最終會“分化成不同垂類的專長公司”,有些擅長家庭場景,有些擅長物流場景,有些擅長工業操作。這很像自動駕駛分化出的格局:高速NOA、城市NOA、記憶泊車、代客泊車……每個細分賽道里都長出了專門的公司。
所以,回到最初的問題,具身智能是在重演自動駕駛嗎?答案是,敘事的節奏確實相似,終極目標被提前消費,Demo和交付之間存在落差,行業在一開始都會追逐最“像人”的解決方案。
但相似的開局,未必導向相同的結局。
自動駕駛花了十年證明,決定勝負的,不是誰最早喊出無人駕駛,而是誰先找到能夠持續產生數據的場景。
今天的具身智能落地場景遠比自動駕駛更分散,人形機器人、家庭服務、通用大腦依然是行業共同追逐的終局,但在終局到來之前,決定行業走向的,或許是倉庫里的叉車、園區里的機器狗、流水線上的機械臂……
它們未必最“像人”,卻最先讓機器人學會成長。

編輯:木人 審校:張問心 制作:瑞總
原文標題 : 火熱的具身智能,藏著半個自動駕駛圈
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 人形機器人“第一股”來了!宇樹科技即將上會
- 2 SpaceX計劃今日確定IPO條款,6月12日掛牌上市,AI業務成增長新引擎
- 3 Agnes AI 發布三大模態核心模型:文本、圖像、視頻
- 4 騰訊云宣布調價:DeepSeek-V4降價97%
- 5 SpaceX上市拒絕中港投資者:資本開啟地緣政治時代
- 6 2026上半年具身智能復盤,瘋狂融資潮背后誰才是“印鈔機”
- 7 支付寶推出全球首個Token Pay服務,AI時代的支付要變天了?
- 8 我們體驗了胡彥斌Vibe Coding的App:方向是對的,細節有點糙
- 9 AI生態之戰打響:微信做入口,騰訊來托底
- 10 3000字深度|物理AI有何魔力?讓孫正義、黃仁勛、孫宇晨同時“上頭”


分享













