火熱的具身智能，藏著半個自動駕駛圈

2026-06-17 14:31

奇點研究社

關注

文章配圖-1

自動駕駛用十年證明，在特定場景里“做到能用”比“看起來像人”更重要，具身智能正在重演這個真理。

文｜妍旭

編輯｜孟雯

2017年的自動駕駛，曾經相信終局會很快到來。

那一年，L4、L5被反復討論，無人駕駛出租車被視為觸手可及的未來。但十年過去，改變行業格局的并非最早承諾“無人駕駛”的公司，而是那些率先把輔助駕駛裝進量產車、跑通數據閉環的人。

今天的具身智能，站在相似的節點。

在剛剛結束的智源大會現場，人形機器人端咖啡、打乒乓球、做動態分揀吸引了眾多圍觀者，“機器人的ChatGPT時刻”也成為被頻繁討論的話題。

但在另一邊，越來越多從自動駕駛行業走出來的創業者，卻在談論如何找到第一個能夠穩定運行的場景，如何建立真實世界的數據閉環，以及如何讓機器人先“跑起來來，再變聰明”。

星源智創始人劉東把自動駕駛稱為“最簡單的具身”。在他看來，從二維空間里的避障導航，到三維空間里的物理交互，機器人面對的是比自動駕駛更復雜的問題。

具身智能是在復刻智駕的敘事節奏嗎？為什么從智駕過來的人成為行業變陣的關鍵變量，他們帶來的“漸進式落地”思路，會讓具身智能走出一條不同的路嗎？

當一個尚未到來的時刻成為行業圖騰

智源大會現場，銀河通用創始人兼CTO王鶴認為機器人的ChatGPT時刻，是指模型具備零樣本能力，無需專門學習即可在特定場景完成70%到80%的人類技能，且具備極高的可訪問性，初中畢業的人就能操作。

星源智創始人劉東則認為：“現在具身也是，大家瞄著實際應用的場景去做，但是L2能落地的也還不多，差不多是2015、2016年的智駕狀態，剛剛起步。”

2017年前后，自動駕駛行業同樣彌漫著類似的樂觀預期：L4級無人駕駛被普遍認為“三到五年量產”，但與此同時，真實的量產車里，連在高速上保持車道和自適應跟車都還在打磨。

無論是彼時的自動駕駛，還是今天的具身智能，都是“終局先于路徑被討論”，行業先形成了對于未來的集體想象，再回頭尋找通往未來的工程路線。

智源大會的現場，這種錯位以另一種形式呈現。人形機器人端咖啡、跟人類打乒乓球、在流水線上做動態分揀，這些Demo在展臺前圍滿了觀眾。

與此同時，星源智最新發布的ω-EVA模型在LIBERO上的成功率達到98.6%，在RoboTwin上的任務成功率從88.9%提升到90.3%。

數字很漂亮，但劉東在采訪時還是給出了相對冷靜的落地分層：純移動的巡檢、導覽已經比較成熟；抓放操作解決了90%的場景，但還有一些品類抓不好；至于酒店打掃、家庭服務等復雜操作，“短期落地還是比較困難”。

這并不意味著Demo沒有價值。恰恰相反，在一個新興技術領域，Demo是技術路線可行性的必要證明。

但需要區分的是，Demo證明的是“這件事在特定條件下可以做到”，而交付要求的是“這件事在多變條件下反復做到”。

這兩者之間的鴻溝，自動駕駛用了10年才走完。

奈何資本和產業端的熱情已經提前就位。智源研究院院長王仲遠提到，本屆大會匯聚了至少15家以上估值超過百億的具身智能CEO，“具身智能與人形機器人”是報名最火的論壇之一。

這讓人很難不聯想到2017年自動駕駛圈的“All in AI”，那時只要項目里有“自動駕駛”四個字，估值和曝光都會自動上一個臺階。

但現實的商業進度，未必跟上了敘事的節奏。星源智是少數能拿出具體落地案例的公司：叉車上的具身大腦、機器狗在開放場景里撿垃圾、物流場景里的自動化揀選。

劉東提到，這些合作是跟客戶“一事一議”談出來的，數據需要共享，場景需要定制。這不是那種“發布即通用”的敘事，而是先找到一個具體的場景，讓系統在里面跑起來，再談泛化。

所以，如果一定要在自動駕駛和具身智能之間畫一條線，可能不是敘事重疊，而是兩個行業在相似階段，面臨著同一種誘惑。

一代智駕人的“二次創業”

像劉東一樣有著自動駕駛背景的創始人，在具身智能領域不在少數。

自動駕駛解決了“讓車在平面上不撞東西”的問題，而具身智能要處理的是“讓設備在三維空間里與物體發生交互”。劉東把智駕比喻為最簡單的具身，“因為智駕當時做的時候，是在平面范圍內避開所有的物體，跟物體不發生交互。

現在具身領域，除了精確的導航行走之外，還要跟三維空間的物體進行交互。”

從“避開”到“拿起”，這個區別聽起來只是動作復雜度的增加，但在工程實現上，卻是一套完全不同的系統約束。

在自動駕駛里，攝像頭和激光雷達主要做環境感知和障礙物識別，決策鏈路相對清晰：看到、判斷、繞行。而在具身智能里，設備不僅要“看到”一個杯子，還要判斷“怎么拿”“拿起來會不會灑”“放下去的位置準不準”。

力控、觸覺、多模態同步，這些在自動駕駛里幾乎不存在的課題，在具身智能里成了日常功課。

所以，當這批從智駕過來的人進入具身領域時，他們帶來的不只是技術棧的遷移，還有一套已經跑過的產業記憶。

2017年的自動駕駛行業，曾經集體陷入“全棧自研”的誘惑，算法、硬件、數據、車輛，全部自己干。當時的邏輯是，只有閉環才能做出最好的體驗。但后來的產業現實證明，在銷量規模起來之前，全棧自研是一個極其昂貴的賭局。

在問及“頭部公司做全棧會不會影響你們”時，劉東的回答帶著這種經驗的痕跡：“在真正的銷量沒有起來之前，是沒有辦法支撐一個公司做全棧研發投入的，除非你已經大到像特斯拉這種規模，賬上根本不缺錢。”

他進一步判斷，市面上近兩百家具身公司里，真正有能力全棧閉環的“頂多就兩三家”，更多的公司會面臨一個選擇題：自己從頭研發大腦，還是從第三方采購？

自動駕駛行業最終證明，全棧自研的門檻極高，只有少數車企能夠負擔。因此行業逐漸分化：一部分資金和技術實力較強的新勢力選擇深度自研，而更多車企，包括部分傳統大廠和缺乏自研基因的新品牌，開始轉向與華為、Momenta、大疆、百度等供應商合作，或采取"部分模塊自研+核心算法外采"的折中路線。

劉東認為，具身智能領域也會呈現類似格局：“有些公司擅長做本體，有些公司擅長做模型，類似于我們以前看自動駕駛在整車行業的發展。”

基于這種判斷，星源智選擇了“不自己做本體”，外界曾把星源智比作“具身賽道的華為”，提供大腦模型和端側算力平臺，覆蓋市面上70%以上的頭部本體客戶。

這個選擇本身，很難說是因為2017年的“失敗教訓”，還是僅僅因為工程師們已經習慣了產業鏈分工的效率邏輯。但有一點是明確的：當一個團隊已經經歷過“什么都想自己做”的階段，他們在進入新戰場時，會更早地思考“什么應該讓別人做”。

除了商業模式的分化，從智駕過來的人還帶來了一套對“落地”的務實認知。

在自動駕駛領域，他們經歷過“云端算力還是車端算力”的路線之爭，知道控制時延對安全系統的意義。

這種經驗在具身智能里被重新激活：劉東在解釋為什么必須端側部署時，給出的不是技術偏好，而是物理約束，十幾個攝像頭加三個激光雷達，每秒數據量是幾個G，如果靠Wi-Fi或5G傳云端，“機器人已經撞上了，云端還在推理”。

所以，他們更早地接受了“端側閉環”的必然性，而不是把它當作一個可選項來討論。

具身智能難以“大力出奇跡”

回看自動駕駛發展歷程，曾經最受關注的是L5和Robotaxi，但率先進入交通系統的，是ADAS和L2+輔助駕駛。

它們沒有L5那么令人興奮，卻在不斷運行中積累數據、完善系統，讓自動駕駛擁有了繼續進化的土壤。

具身智能也在經歷類似的過程。家庭保姆機器人仍然遙遠，通用機器人大腦也尚未成熟，但叉車、機器狗、物流揀選等場景已經開始落地。它們未必最像人，卻最有機會率先跑通數據閉環。

如果說ADAS是自動駕駛通往L4的橋梁，那么今天的叉車和機器狗，就是具身智能通往AGI的橋梁。

劉東把落地難度分為三層，第一層是“純移動”：巡檢、導覽、導購，機器人只需要在空間里行走、識別目標、拍照記錄，不需要與物體發生復雜的物理交互。這一層已經比較成熟，星源智的機器狗在開放場景里撿垃圾、做清潔，就是這層的應用。

第二層是“抓放操作”，倉庫里的揀選、藥店的上下料、工廠里的簡單搬運。劉東坦承，這一層已經解決了90%的場景，但“還有一些品類是抓不好的，成功率也不高”。這10%的缺口，聽起來很小，但在真實商業環境里，可能就是客戶是否愿意簽單的關鍵。對應到2017年的自動駕駛，這很像“高速NOA”剛上線時的狀態：能跑，但還不敢讓用戶完全脫手。

第三層是“復雜操作”，酒店打掃、家庭服務、精細裝配。這些場景涉及多步驟任務鏈、非結構化環境、柔性物體的操作，劉東的判斷是“短期落地還是比較困難”。

這種“分層”既帶著從智駕移植過來的工程務實，也受限于具身智能的數據約束。星源智聯合創始人孫振國在采訪中提到，大語言模型可以從互聯網上免費獲取幾乎無限的語料，但具身智能沒有“互聯網級別的物理數據”。

各地政府牽頭建的數采廠，投入了大量機器人設備去采集動作數據，但采集到的數據量對于超大規模訓練來說，仍然遠遠不夠。大語言模型可以堆到幾百B甚至上千B的參數，而具身模型目前還在幾B、幾十B的規模徘徊。

這個瓶頸意味著，具身智能不可能像大語言模型那樣，通過“大力出奇跡”的方式一夜之間突破。它必須像自動駕駛一樣，在具體的場景里一圈一圈地跑，用真實的物理交互去喂養模型。

劉東在描述叉車的落地案例時，給出了一個很有說服力的細節：以前物流倉庫里也有自動化方案，但它們是“基于規則的”必須保證卡車停在準確的位置，貨物有準確的托盤，托盤有準確的形狀。

而具身大腦的價值在于，它可以“柔性地面對不同任務”，卡車大小不同、貨物形態各異、托盤可有可無，系統仍然能自主規劃卸貨邏輯，先卸什么后卸什么，避免碰撞和卸不干凈。

這種“柔性”，不是通過更大的模型一次性實現的，而是通過“特定場景的數據閉環”慢慢磨出來的。

星源智的叉車項目用了“兩個月左右”做出第一版系統，這個速度在具身智能領域算是很快，但劉東強調，他們復用了之前的算法基座，并且“完全端側部署”。

這也對應了劉東對未來格局的判斷：具身大腦公司最終會“分化成不同垂類的專長公司”，有些擅長家庭場景，有些擅長物流場景，有些擅長工業操作。這很像自動駕駛分化出的格局：高速NOA、城市NOA、記憶泊車、代客泊車……每個細分賽道里都長出了專門的公司。

所以，回到最初的問題，具身智能是在重演自動駕駛嗎？答案是，敘事的節奏確實相似，終極目標被提前消費，Demo和交付之間存在落差，行業在一開始都會追逐最“像人”的解決方案。

但相似的開局，未必導向相同的結局。

自動駕駛花了十年證明，決定勝負的，不是誰最早喊出無人駕駛，而是誰先找到能夠持續產生數據的場景。

今天的具身智能落地場景遠比自動駕駛更分散，人形機器人、家庭服務、通用大腦依然是行業共同追逐的終局，但在終局到來之前，決定行業走向的，或許是倉庫里的叉車、園區里的機器狗、流水線上的機械臂……

它們未必最“像人”，卻最先讓機器人學會成長。

編輯：木人審校：張問心制作：瑞總

原文標題 : 火熱的具身智能，藏著半個自動駕駛圈

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權或其他問題，請聯系舉報。

發表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務

忘記密碼

其他方式

請輸入評論內容...

請輸入評論/評論長度6~500個字

暫無評論

圖片新聞

新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

發表評論

登錄