VLA
-
自動駕駛技術競爭升級,VLA之后是什么。
2026年,自動駕駛行業的內卷邏輯,正在發生第三次重構。 短短數年間,行業快速走完了硬件堆砌競賽、端到端算法博弈兩個階段,以小鵬、理想為代表的新勢力車企和吉利、長城等傳統車企扎堆入局VLA(視覺-語言
-
VLA是怎么讓自動駕駛有駕駛邏輯的?
目前的自動駕駛技術正處于一個關鍵的十字路口,新技術層出不窮。雖然現有的視覺感知和規劃算法已經能夠處理大部分常規路況,但在面對復雜的人類社交行為和從未見過的突發狀況時,傳統系統依舊會表現得過于死板。為了
-
VLA已死?這家公司想用 VLOA 給機器人裝上“物理直覺”
作者|李沐蓉 今年5月,英偉達機器人負責人 Jim Fan 在紅杉峰會上拋出一句話:「VLA已死」。 這四個字,把具身智能行業積壓已久的焦慮推上了臺面。 機器人泛化這道題,究竟該怎么解? 完成 10
-
RL Token:破解 VLA “最后一厘米”精度難題,在線強化學習機器人精準操控
一臺機器人拿起螺絲刀并不難,難的是讓它在幾秒鐘內,精準地把刀頭對準一枚細小的螺絲。 這不是未來世界的科幻場景,而是今天機器人操作中最現實、也最棘手的問題。 當前,VLA模型在疊衣服、沖泡咖啡、制作烤奶
-
-
元戎啟行的 40B VLA 自動駕駛基座模型和方法論
元戎作為中國輔助駕駛/自動駕駛算法供應商的后起之秀,在這兩年來量產車輛大幅度上升,擁有長城、吉利、甚至傳言拿下了新勢力零跑的業務。而且元戎也是比較早喊“VLA”甚至量產"VLA"的供應商。 所以,算是
-
小鵬和理想均押注VLA,兩者技術各有啥特色?
隨著高級輔助駕駛功能越發完善,高速NOA、城市NOA的使用已經較為普遍,這其中離不開VLA(視覺-語言-動作)模型的推動。 VLA大模型的出現,也標志著行業正式從“感知識別”邁向了“理解決策”。以前的
-
為什么很多車企都青睞VLA模型?
就在最近,小鵬發布了第二代視覺—語言—動作(VLA)模型。其實隨著自動駕駛技術的發展,行業正處于從手工規則體系向物理世界大模型的深層跨越。早期的自動駕駛方案高度依賴于模塊化的架構設計,將感知、預測與規
-
已有VLM,自動駕駛為什么還要探索VLA?
自動駕駛技術正處于發展的轉折點。過去十幾年間,行業長期依賴模塊化的技術路徑,即將駕駛任務拆解為感知、預測、規劃和控制四個獨立環節。這種結構雖然清晰,但在面對突發狀況時(長尾場景),會因規則覆蓋不足而表
-
VLA和世界模型在自動駕駛中可以融合嗎?
隨著VLA(視覺-語言-動作模型)與世界模型在自動駕駛領域的關注度日益提升,這兩項技術已成為眾多主機廠研發布局的重點方向。前者強調將感知、語義推理與動作生成整合到同一個大模型中,以實現端到端的決策輸出
自動駕駛 2026-01-13 -
定義下一代機器人訓練,智元 SOP:VLA 模型真實世界分布式在線后訓練的關鍵突破
當前,VLA模型通過大規模預訓練具備了出色的泛化能力,但在實際場景部署時,除了需要廣泛的通用性,還需達到專家級的任務執行水平。以家庭機器人為例:它必須能夠折疊衣物、整理貨架、組裝家具,同時展現出堪比專
-
VLA模型是基于預置規則來指導行動嗎?
今天繼續來回答小伙伴的提問,最近有一位小伙伴提問,VLA模型中的理解是不是也基于一些預置的規則指導行動的?其實這個問題非常值得討論,今天智駕最前沿就帶大家詳細聊一聊。 視覺-語言-動作(VLA)模型是
-
-
VLA與世界模型有什么不同?
當前自動駕駛行業,各車企的技術路徑普遍選擇了單車智能方向。而在實際落地過程中,不同企業選擇了差異化的技術實現方式,部分車企側重于視覺—語言—動作模型(Vision Language Action,VL
世界模型 2025-12-17 -
π*0.6:一款能從經驗中學習的VLA模型
今日,美國具身智能創業公司 Physical Intelligence(簡稱 PI )發布了最新機器人基礎模型?π*0.6。 官方稱,過去一年,機器人成功完成一半任務并不難,但要讓它每次都成功卻非常困
VLA 2025-12-01 -
重磅!阿里達摩院發布首個VLA與世界模型統一架構RynnVLA-002:97.4%成功率刷新認知
作者:Jun Cen等 解讀:AI生成未來 亮點直擊 統一架構:RynnVLA-002,這是一個將視覺-語言-動作(VLA)模型與世界模型統一在單一框架中的“動作世界模型”。 雙向增強:實現了 VLA
-
VLA能解決自動駕駛中的哪些問題?
很多從事自動駕駛的小伙伴應該對VLA這個概念已經非常熟悉了。VLA即“Visual-Language-Action”(視覺—語言—動作)模型,它的核心是將視覺信息、語言表達和動作控制這三者整合到一個統
-
吳新宙帶領英偉達沖刺自動駕駛L4背后的VLA大模型算法
2023年8月,吳新宙算是在中國L2+智能輔助駕駛競爭頂峰--輔助駕駛進城之后離開小鵬汽車加入英偉達。2024年1月,特斯拉推出FSD V12 Beta端到端版本,智能輔助駕駛算法進入“端到端”階段。
-
VLA和世界模型,誰才是自動駕駛的最優解?
隨著自動駕駛技術發展,其實現路徑也呈現出兩種趨勢,一邊是以理想、小鵬、小米為代表的VLA(視覺—語言—行動)模型路線;另一邊則是以華為、蔚來為主導的世界模型(World Model)路線,這兩種路徑都
自動駕駛 2025-11-05 -
自動駕駛上常提的VLA與世界模型有什么區別?
VLA:把“看”和“說”連到“做”上 自動駕駛中常提的VLA,全稱是Vision-Language-Action,直譯就是“視覺-語言-動作”。VLA的目標是把相機或傳感器看到的畫面、能理解和處理自然
自動駕駛 2025-10-14 -
為什么把VLA直接放上自動駕駛汽車沒那么容易?
在自動駕駛領域,經常會有技術提出將VLA(視覺—語言—動作模型)應用到自動駕駛上。VLA的作用就是把看、懂、決策三件事交給一個大模型,攝像頭看到畫面,模型用“視覺+語言”去理解場景和意圖,最后直接輸出
-
揭秘小鵬自動駕駛「基座模型」和 「VLA大模型」
2025年的CVPR自動駕駛 Workshop上,小鵬汽車的Liu Xianming先生做了一篇名為《Scaling up Autonomous Driving via Large Foundatio
-
端到端自動駕駛的前世今生:不管VLA還是WM世界模型,都需要世界引擎。
2025年的CVPR自動駕駛Workshop上,香港大學的Li Hongyang做了一篇名為《自動駕駛端到端方法:現狀與展望》的開場演講。 演講給了端到端一個定義,并介紹了端到端的前世今生,以及挑戰,
自動駕駛 2025-09-10 -
VLA與世界模型會讓自動駕駛汽車走多遠?
在一個雨夜的十字路口,你開車行駛到路中央,前方是一輛猶豫不決的電動車,左側有一臺打著轉向燈的出租車,右后方突然閃過一束遠光燈。這時候你會怎么做?經驗豐富的司機往往會迅速分析,電動車可能突然橫穿,出租車
-
-
自動駕駛中常提的VLM是個啥 ?與VLA有什么區別?
自動駕駛車輛要在復雜多變的道路環境中安全行駛,不僅需要“看見”前方的車輛、行人和路面標志,還需要“讀懂”交通標識上的文字提示、施工告示牌和乘客的語言指令。之前和大家討論過VLA(相關閱讀:自動駕駛中常
-
具身智能VLA困于“數據泥潭”,靠人類活動視頻數據能否破局?
前言 盡管當前的視覺-語言-動作(VLA)模型已展現出顯著進展,但其在新場景和與復雜物體交互中的性能會顯著下降,在遵循指令方面落后于像LLaVA 這樣的大型多模態模型(LMM)。 這種局限性源于現有V
-
從“模仿”走向“思考”:VLA司機大模型帶來的變化
芝能智芯出品 VLA(Vision-Language-Action)駕駛大模型是理想汽車在2025年八月即將實現重要落地的輔助駕駛。 不同于第一代的結構化算法和第二代的端到端系統,采用了新的視覺-語言
-
VLA模型如何重塑具身智能 —— 8家國內外典型具身智能VLA模型梳理與分析
一、國外典型具身智能VLA架構 國外4家典型的具身智能VLA模型:谷歌DeepMind RT-2、Physical AI? π0?、Figure AI Helix 、英偉達GR00T N1。 1.?谷
-
谷歌具身智能VLA模型RT-H—— 基于語言的動作分層框架
2024年3月,谷歌DeepMind正式推出端到端的框架RT-H。它是一個帶動作分層結構的機器人Transformer ——?將語言化動作作為高級任務描述與低級動作之間的中間預測層,從而通過語言化動作
-
產業丨谷歌發布本地VLA模型,具身智能正在進入“端側時代”
前言:如果過去十年機器人領域的焦點先后經歷了[可見]的視覺感知、[可理解]的語言理解,那么在VLA模型出現之后,機器人開始進入[動作精準]的第三階段。目前,VLA模型已逐漸成為具身智能行業的共識,被視為連接感知、語言和行為的通用架構
-
谷歌具身智能VLA大模型 —— Gemini Robotics : 將人工智能帶入到物理世界
引言 真正實用的機器人需要能夠理解周圍的物理世界,并以可靠且安全的方式與之交互。也就是說,基于物理實體的AI智能體必須具備魯棒的人類級具身推理能力,即包含在物理具身世界中操作和運行所需的基礎概念的世界知識體系
-
自動駕駛中常提的VLA是個啥?
隨著自動駕駛技術落地,很多新技術或在其他領域被使用的技術也在自動駕駛行業中得到了實踐,VLA就是其中一項,尤其是隨著端到端大模型的提出,VLA在自動駕駛中的使用更加普遍。那VLA到底是個啥?它對于自動
-
一文看懂視覺語言動作模型(VLA)及其應用
VLA 應該是自動駕駛以及機器人產業前沿最熱的 AI人工智能詞語。我們之前文章《2025年,自動駕駛即將開“卷”的端到端大模型 2.0 - VLA (Vision Language Action)》也分享和預言過它是自動駕駛大模型2.0
視覺語言動作模型 2025-06-12 -
邁向人類級駕駛智能:VLA視覺語言的行動模型
芝能科技出品2025年,由于安全和強監管的作用,輔助駕駛行業正處于黎明前的黑暗。面對復雜的現實路況、多樣的人類行為模式,以及傳統AI在泛化和理解能力上的瓶頸,理想汽車在《AI Talk第二季》系統性的闡述了“VLA(視覺語言行動模型)”
-

