新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

<span id="fwlqq"><th id="fwlqq"></th></span>

當(dāng)前位置： OFweek 人工智能網(wǎng) > 計算機視覺 > 正文

具身智能落地，開始補“感知”這一課

2026-04-23 16:30

作者｜向欣

具身智能行業(yè)的一個共識是，今年將會成為人形機器人的量產(chǎn)落地元年。

規(guī)模鋪開的同時，機器人面對的環(huán)境也在發(fā)生變化：實驗室里的結(jié)構(gòu)化場景，正逐漸讓位于更加開放的現(xiàn)實世界。

機器人一旦進入真實環(huán)境，感知層的重要性就會迅速凸顯，而這一層能力在過去長期被低估。

機器人的執(zhí)行閉環(huán)是「感知—決策—動作」。感知一旦掉鏈子，后續(xù)的操作和決策將無法有效執(zhí)行。

最近的人形機器人半程馬拉松就是一個開放場景——長時間戶外奔跑、光照變化、路面起伏，讓不少機器人的感知系統(tǒng)暴露出不穩(wěn)定的問題。

快到終點的人形機器人突然轉(zhuǎn)彎跑進人群

一套足夠穩(wěn)定、精準(zhǔn)的感知系統(tǒng)，是機器人能否在開放環(huán)境中可靠工作的前提。

也正因此，感知層那些原本低存在感的核心零部件，正在被重新估值，感知層，成為機器人落地的關(guān)鍵卡口之一。

順著這條邏輯往下看，機器人感知能力大致可以分為三層：環(huán)境感知、本體狀態(tài)感知，以及交互與操作感知。

看見世界——環(huán)境感知傳感器

環(huán)境感知是機器人進入真實場景的第一道門檻。它決定機器人能不能識別物體、理解空間、判斷距離，從而完成導(dǎo)航、避障和抓取定位。

在這一層，核心硬件主要包括兩類：

一是視覺傳感器，包括 RGB 相機、雙目相機、深度相機、魚眼相機，主要提供圖像、紋理和部分深度信息；

二是空間感知類傳感器，主要為激光雷達，提供穩(wěn)定的距離和空間結(jié)構(gòu)信息。

奧比中光Gemini 330系列雙目3D相機

不過，在真實環(huán)境中，采集到圖像信息，并不意味著機器人已經(jīng)能看懂周圍環(huán)境。

例如，在復(fù)雜光照、動態(tài)人流和室內(nèi)外交替的環(huán)境中，RGB 相機獲取的畫面很容易失真。逆光條件下，目標(biāo)區(qū)域可能變得昏暗難辨；強反光會削弱物體邊緣和輪廓信息；到了夜間，圖像質(zhì)量還會進一步下降。

環(huán)境中的人和物持續(xù)移動，也會增加識別和定位難度，視覺系統(tǒng)容易出現(xiàn)目標(biāo)丟失、距離判斷偏差等問題。

除了復(fù)雜光照下穩(wěn)定性不夠，動態(tài)場景理解難的問題，環(huán)境感知層面還有兩個難點。

一個是手眼協(xié)同要求高。視覺與激光雷達的觀測會隨肢體運動產(chǎn)生動態(tài)畸變、視角跳變、運動模糊，導(dǎo)致目標(biāo)位置與深度測量出現(xiàn)瞬時誤差。

手、眼、物體三者的相對位姿需要亞厘米級甚至更高精度的實時匹配，稍有偏差就會導(dǎo)致抓取偏移、碰撞或跟蹤丟失。

另一個是算力與延遲壓力大。

視覺和激光雷達本身都是高數(shù)據(jù)量傳感器。攝像頭持續(xù)輸出圖像流，激光雷達持續(xù)輸出點云。而機器人通常需要裝多個傳感器，多目相機、深度相機、魚眼相機、激光雷達一起工作。

這樣一來，前端采集到的數(shù)據(jù)量會非常大，但多源信息融合、3D 建圖、目標(biāo)檢測與跟蹤、動態(tài)障礙物分割等算法本身復(fù)雜度高，因此對端側(cè)算力提出很高要求。

其次，環(huán)境信息處理一旦不夠及時，哪怕只是數(shù)百毫秒的延后，經(jīng)過層層傳遞，系統(tǒng)拿到的也可能已經(jīng)落后于現(xiàn)場變化。

這會導(dǎo)致路徑判斷出現(xiàn)偏差，避障反應(yīng)變慢，抓取位置不準(zhǔn)，還會進一步影響整機動作的穩(wěn)定性。

因此，機器人進入真實場景后，環(huán)境感知器件需要進行一輪明顯的升級，從基礎(chǔ)的視覺采集，升級為精準(zhǔn)識別、穩(wěn)定跟蹤與空間理解能力。

圍繞這些問題，行業(yè)當(dāng)前的重點方向主要集中在深度感知和空間理解兩個方面。

所謂深度感知，就是讓機器人在識別目標(biāo)之外，進一步獲得距離、輪廓和空間層次信息。

空間理解則是在此基礎(chǔ)上，對場景結(jié)構(gòu)、障礙物分布、目標(biāo)物體與周圍環(huán)境的關(guān)系形成更完整的判斷。

沿著這個方向，行業(yè)出現(xiàn)了兩種解法：

從二維看圖像升級到三維空間理解；

向多傳感器融合演進：從單一視覺升級到視覺+激光雷達等融合方案。

在這一過程中，一批代表性企業(yè)已經(jīng)沿著不同路線展開布局。

奧比中光的重點落在深度視覺能力上。其 Gemini 330 系列雙目 3D 相機搭載面向機器人場景自研的深度引擎芯片 MX6800，結(jié)合主動與被動成像技術(shù)，能夠在黑暗、強光等差異較大的光照條件下輸出較為穩(wěn)定的三維數(shù)據(jù)。

禾賽的思路更偏向空間數(shù)據(jù)采集與場景還原。其推出的空間智能 AI 硬件產(chǎn)品 Kosmo，將定制化激光雷達、多個攝像頭、空間感知算法和 AIGC 能力集成到一個小型設(shè)備中，能夠把物理三維世界還原為對應(yīng)的數(shù)字化三維場景。

速騰聚創(chuàng)則在多傳感器融合和系統(tǒng)簡化方向上推進。其推出的 Active Camera，被定位為「機器人之眼」，將深度、色彩和姿態(tài)三類核心感知信息在芯片層面進行集成，實現(xiàn)毫秒級時空同步。

相比傳統(tǒng)多傳感器疊加方案，這種做法減少了系統(tǒng)復(fù)雜度，也有助于提升感知結(jié)果的一致性和響應(yīng)效率。

各家廠商的側(cè)重點雖有不同，但目標(biāo)一致：

讓機器人在復(fù)雜多變的真實場景中，獲得足夠穩(wěn)定、精準(zhǔn)的空間理解能力。

感知自己——本體狀態(tài)感知傳感器

光有對環(huán)境的基礎(chǔ)感知還不夠。機器人要想在動態(tài)中保持平衡、精確出力，還需要另一套「體內(nèi)感官」——感知自己。

人形機器人是一個高動態(tài)系統(tǒng)，走路、轉(zhuǎn)身、上下坡、受擾動、落腳時，都需要實時知道自己的姿態(tài)、速度和受力變化，才能維持平衡、控制發(fā)力，并完成更穩(wěn)定的動作執(zhí)行。

支撐這一層能力的核心器件，主要可以分為兩類：

一類是慣性傳感器，代表產(chǎn)品是 IMU，它相當(dāng)于具身智能機器人的「小腦」與前庭系統(tǒng)，核心用于測量自身角速度、線性加速度，支撐姿態(tài)估計與動態(tài)平衡。

另一類是力矩與力傳感器，包括關(guān)節(jié)扭矩傳感器、六維力傳感器和足底力傳感器，負責(zé)感知關(guān)節(jié)、腕部、足底等位置的受力變化。

本體狀態(tài)感知層的難點主要集中在三點。

第一，對響應(yīng)速度和穩(wěn)定性要求很高。

如果本體狀態(tài)感知出現(xiàn)延遲，后續(xù)控制就容易滯后，打亂動作節(jié)奏。同時，在執(zhí)行高動態(tài)動作的過程中，震動、沖擊、快速轉(zhuǎn)向和落地反饋又會放大誤差，影響就會傳遞到整條控制鏈路中。

第二，量產(chǎn)階段對一致性提出了更高要求。

樣機能夠跑通，并不意味著批量產(chǎn)品在長時間運行中也能保持同樣穩(wěn)定的表現(xiàn)。機器人進入量產(chǎn)后，傳感器的一致性和可靠性會變得更加關(guān)鍵。

第三，小型化、集成和成本壓力并存。

六維力和力矩傳感器通常要安裝在腕部、夾爪末端甚至靈巧手等空間有限的位置，既要做得足夠小，又要兼顧測量精度、結(jié)構(gòu)強度和系統(tǒng)兼容性。

而且這類器件的成本一直偏高。以特斯拉機器人為例，雙腳所用的兩個六維力傳感器成本就達到 6700 美元。

因此，傳感器的小型化、高動態(tài)適應(yīng)性和量產(chǎn)一致性，是當(dāng)前行業(yè)攻堅的重點。

在這個領(lǐng)域內(nèi)，出現(xiàn)了兩種代表性玩家。

一類是從智駕領(lǐng)域切入、在汽車體系里積淀深厚的玩家，以導(dǎo)遠科技為代表。

導(dǎo)遠科技推出了車規(guī)級 IMU 模組 IMU5146，并已向銀河通用交付。

該 IMU 模組姿態(tài)測量精度達到 0.05°，輸出頻率 1000Hz 且延遲極低，能夠?qū)崟r捕捉機器人的微小傾斜與晃動，有效避免響應(yīng)滯后導(dǎo)致的失衡。

更重要的是，導(dǎo)遠把車規(guī)級的可靠性、一致性和量產(chǎn)能力帶入了機器人自身感知層。

其產(chǎn)品支持-40℃至 105℃寬溫運行，可承受 2000g 極限沖擊，適配人形機器人在跳躍、翻滾等高強度動態(tài)下的感知需求。

此外，導(dǎo)遠擁有從底層芯片、算法軟件到模組系統(tǒng)及精密制造的全棧能力，能夠從芯片級開始定義產(chǎn)品邏輯，具備較高的靈活性。

基于這種可擴展、高可靠且經(jīng)濟高效的時空智能解決方案，導(dǎo)遠已經(jīng)成功從汽車向機器人、工程機械、可再生能源系統(tǒng)等領(lǐng)域快速擴張。

另一類是以坤維科技和鑫精誠為代表的專業(yè)力傳感器廠商。

坤維科技推出了專為人形機器人手腕和腳踝設(shè)計的 HRS 人形系列，最薄尺寸僅 10 毫米，重復(fù)精度優(yōu)于 0.1%FS，已批量供貨優(yōu)必選、智元、銀河通用等頭部企業(yè)。

鑫精誠則聚焦 MEMS 六維力傳感器，已完成試樣驗證并形成小批量訂單，正在建立覆蓋指尖、手腕、腳踝三大關(guān)鍵部位的自動化產(chǎn)線，布局更多指向后續(xù)的規(guī)�；┙o能力。

接觸世界——交互與操作感知傳感器

有了視覺和本體感知，機器人可以走路、避障、站得穩(wěn)。但要真正干活，比如插拔接口、捏起一顆雞蛋、整理柔軟的衣物——它還缺一層最接近皮膚的能力：觸覺。

很多具身智能的高價值任務(wù)，都是精細操作任務(wù)，拿起、放下、插接、裝配、抓柔性物體，都依賴細膩的觸覺反饋。

雖然觸覺感知傳感器還遠沒有像環(huán)境感知和自身感知那樣成熟，但它很可能成為下一階段靈巧操作的分水嶺。

現(xiàn)階段常見的觸覺傳感器主要包括電子皮膚、指尖觸覺、陣列式壓力傳感器和視觸覺傳感器。

它們分布在機器人手部、夾爪和末端執(zhí)行器等位置，承擔(dān)接觸檢測、壓力感知、材質(zhì)識別和形變判斷等任務(wù)。

這一領(lǐng)域面臨諸多難點。

首先，觸覺數(shù)據(jù)目前缺少足夠成熟產(chǎn)品和標(biāo)準(zhǔn)體系。

一位具身智能公司的創(chuàng)始人曾表示，目前市面上沒有成熟且可規(guī)模應(yīng)用的觸覺傳感器產(chǎn)品。不同產(chǎn)品、不同方案之間的定義和采集方式并不統(tǒng)一，導(dǎo)致數(shù)據(jù)復(fù)用難度較高。

其次，耐久性仍然是一個現(xiàn)實問題。觸覺傳感器長期處在接觸、摩擦、擠壓的工作狀態(tài)中，對壽命和穩(wěn)定性的要求很高。

而且，觸覺傳感器的集成難度同樣非常高。手指和末端執(zhí)行器的空間有限，傳感器既要做得薄，還要兼顧靈敏度和穩(wěn)定性。

同時，在算法上也難以融合。觸覺信號和視覺、動作控制之間的協(xié)同仍然比較復(fù)雜，算法融合還在持續(xù)摸索。

最后是同樣存在的成本問題，觸覺至今還沒有像視覺那樣走到大規(guī)模低成本普及的階段。

因此，在觸覺這一層，很多公司還在解決耐久性、成本和數(shù)據(jù)難題。

帕西尼感知的布局重點放在兩端，一端是傳感器產(chǎn)品本身，另一端是圍繞觸覺構(gòu)建的數(shù)據(jù)體系。

產(chǎn)品層面，帕西尼推出了多維觸覺傳感器 PX-6AX-GEN3，可輸出六維力、力分布、材質(zhì)、溫度、回彈等多類觸覺信息，具備耐磨抗穿刺與 1000 萬次的超高工業(yè)級使用壽命，在 0~50°C 的高低溫環(huán)境下，也能進行高一致性的觸覺信息輸出。

帕西尼還在建設(shè)全模態(tài)數(shù)據(jù)采集工廠，除了 2025 年 4 月在天津落成的全球最大全模態(tài)超級數(shù)據(jù)采集工廠 Super EID Factory 外，還計劃在江蘇宿遷、湖北武漢、四川自貢、江西贛州再建 4 座超級數(shù)據(jù)采集工廠；并與云廠商合作推進大規(guī)模具身智能數(shù)據(jù)云商城。

他山科技的切入點更偏底層芯片和感知能力融合。

其研發(fā)的數(shù)�；旌� AI 觸感芯片，能夠支持高精度三維力感知，也能夠識別部分材質(zhì)信息和近距離接觸特征。

戴盟機器人則把重點放在觸覺數(shù)據(jù)集建設(shè)上，聯(lián)合多家學(xué)術(shù)機構(gòu)與企業(yè)，發(fā)布了全球最大規(guī)模含觸覺全模態(tài)物理世界具身數(shù)據(jù)集 Daimon-Infinity。

戴盟稱，Daimon-Infinity 提供了目前行業(yè)內(nèi)最高質(zhì)量的觸覺數(shù)據(jù)。

Daimon-Infinity 數(shù)據(jù)集依托于戴盟自研的二指夾爪及五指手套數(shù)據(jù)采集設(shè)備，其搭載的含 11 萬感知單元、120Hz 高頻率視觸覺傳感器，配合魚眼相機、編碼器、IMU、雙目相機，為數(shù)據(jù)集提供觸覺、視覺、動作軌跡、執(zhí)行動作、語音文本等全維度信息。

總體來看，機器人感知能力的推進路徑，對應(yīng)著三個層次的競爭焦點；

視覺為主的環(huán)境感知傳感器是入口，負責(zé)讓機器人看見并理解環(huán)境；

力覺為主的本體狀態(tài)感知傳感器是當(dāng)下的卡點，決定了機器人在動態(tài)世界中能否站穩(wěn)、發(fā)力、安全交互；

觸覺是下一階段的突破口，將真正區(qū)分「能動的機器人」和「能干的機器人」。

無論是馬拉松賽場、工廠產(chǎn)線，還是倉儲分揀、家庭服務(wù)，人形機器人的規(guī)�；涞囟际加诟兄到y(tǒng)。

感知層采集的信息質(zhì)量會層層傳導(dǎo)，影響后續(xù)決策和動作執(zhí)行。

機器人的應(yīng)用場景正從少量樣機驗證、單一環(huán)境部署，逐步拓展至更復(fù)雜的真實場景，同時需要滿足更長時間連續(xù)運行、更高頻率規(guī)模化部署的要求。

因此整套感知鏈路能否形成穩(wěn)定、可復(fù)制、可量產(chǎn)的工業(yè)能力，會越來越明顯地影響機器人進入真實場景的速度。

這一層能力的突破，可能是決定機器人產(chǎn)業(yè)化進程的關(guān)鍵所在。

原文標(biāo)題 : 具身智能落地，開始補“感知”這一課

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權(quán)或其他問題，請聯(lián)系舉報。

發(fā)表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務(wù)

忘記密碼

其他方式

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

暫無評論

暫無評論

圖片新聞

最新發(fā)布

最新活動更多

一周熱點月點擊榜

企業(yè)服務(wù) 廣告服務(wù) 獵頭服務(wù) 薪酬報告

人工智能獵頭職位更多

高級軟件工程師廣東省/深圳市
自動化高級工程師廣東省/深圳市
光器件研發(fā)工程師福建省/福州市
銷售總監(jiān)（光器件）北京市/海淀區(qū)
激光器高級銷售經(jīng)理上海市/虹口區(qū)
光器件物理工程師北京市/海淀區(qū)
激光研發(fā)工程師北京市/昌平區(qū)
技術(shù)專家廣東省/江門市
封裝工程師北京市/海淀區(qū)
結(jié)構(gòu)工程師廣東省/深圳市

掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容

文章糾錯

x

_*文字標(biāo)題：

_*糾錯內(nèi)容：

聯(lián)系郵箱：

_*驗證碼：

看不清，點擊換一張

粵公網(wǎng)安備 44030502002758號

^{<noscript id="wym6y"></noscript>}

<small id="wym6y"></small>

<td id="wym6y"></td>

<noscript id="wym6y"></noscript>