華為盤古大模型在自動駕駛領域做了什么 ?

2026-06-16 10:25

就在最近，華為的盤古大模型因某些事件被大家廣泛討論，智駕最前沿作為一個以技術內容為主的平臺，僅聊技術，不聊八卦，但也想蹭一蹭熱點，今天就基于網上的公開資料以及一些官方的宣傳內容，給大家理一下盤古大模型及其在自動駕駛領域的技術布局，也希望大家理性評論！

盤古大模型的技術架構與演進

盤古大模型最早于2021年4月在華為開發者大會上正式對外發布，初始階段主要包含NLP（自然語言處理）、CV（計算機視覺）和科學計算三大基礎模型。盤古NLP大模型是業界首個千億級參數的中文預訓練大模型，CV大模型則具備30億參數，兩者在當時均處于行業領先水平。

2022年4月，盤古大模型升級至2.0版本，正式確立了L0、L1、L2的分層開發架構。同年，華為陸續發布了面向礦山、氣象、海浪等垂直場景的行業大模型，標志著盤古從通用大模型向行業應用的延伸。2023年7月，盤古大模型3.0正式發布，確立了5+N+X的分層架構，并明確提出不作詩，只做事的定位，專注于B端產業場景落地。

圖片源自：網絡

此后，盤古大模型保持每年一次的升級節奏，2024年6月發布5.0版本，引入可控時空生成（STCG）技術；2025年6月發布5.5版本，五大基礎模型全面升級；2026年6月正式發布openPangu 2.0，并計劃于計劃&zwnj;2026年6月30日&zwnj;起，分批開放包括預訓練代碼、后訓練代碼、訓練算子等在內的&zwnj;7大核心組件。

盤古大模型的底層訓練是基于華為自研的昇騰AI云服務，在硬件上，2025年6月發布的新一代昇騰AI云服務采用CloudMatrix 384超節點架構，將384顆昇騰NPU與192顆鯤鵬CPU通過全對等互聯整合為一臺超級AI服務器，單卡推理吞吐量達到2300 Tokens/s，相比非超節點架構提升約4倍。該云服務同時支持PyTorch、TensorFlow等主流AI框架，并提供算子遷移工具，可將大部分從GPU平臺開發的算子遷移至昇騰平臺運行。

在軟件架構層面，盤古大模型采用5+N+X三層設計。L0層包含自然語言處理、計算機視覺、多模態、預測及科學計算等五個基礎大模型，經過千億級參數的預訓練形成通用能力底座。L1層是在基礎模型之上，通過行業數據注入訓練形成的行業大模型，覆蓋政務、金融、制造、礦山、氣象等領域。L2層則聚焦具體業務場景進行精調，提供場景化的模型服務。這種分層解耦的設計允許客戶獨立加載數據集、單獨升級基礎模型或能力集，也可根據數據安全和合規需求選擇公有云、大模型云專區或混合云等部署形態。

圖片源自：網絡

盤古大模型5.5版本于2025年6月正式發布，五大基礎模型均進行了升級。

NLP大模型推出了7180億參數的MoE深度思考模型，由256個專家組成，在知識推理、工具調用、數學等領域能力有所增強。自適應快慢思考融合讓模型可根據問題難易程度自動切換思考模式，簡單問題快速響應，復雜問題調動更多算力進行推理，整體推理效率提升8倍。此外，Pangu DeepDiver通過搜索強度縮放技術在真實互聯網環境下進行探索式訓練，7B規模的DeepDiver在多個基準測試中的表現與671B的DeepSeek-R1相當。

CV大模型升級為300億參數的MoE架構視覺大模型，據稱是當時業界最大的視覺模型，全面支持圖像、紅外、激光點云、光譜、雷達等多維度感知、分析與決策。

預測大模型則采用了triplet transformer統一預訓練架構，將不同行業的數據（如工藝參數的表格數據、設備運行日志的時間序列數據、產品檢測的圖片數據）進行統一的三元組編碼，在同一框架內高效處理和預訓練。

多模態大模型的升級方向則是世界模型，后面會單獨展開討論。

科學計算大模型則是與深圳氣象局合作升級了智霽大模型，首次實現AI集合預報；與重慶市氣象局打造了天資·12h氣象大模型，可用于災害性天氣的日內預報預警。

整體來看，盤古大模型的技術路線強調行業落地而不是通用對話能力，其分層設計和對計算效率的優化都是圍繞這一目標展開的。

盤古世界模型與STCG，自動駕駛開發的新路徑

在自動駕駛開發中，數據一直是最核心的瓶頸，要讓自動駕駛系統達到足夠的可靠性，理論上需要基于真實道路采集的上百億公里駕駛數據進行訓練，這對任何車企來說都是不可承受的成本。盤古大模型針對這一問題提出的解決方案，經歷了從STCG到世界模型兩個階段。

1）STCG，讓模型理解物理世界

可控時空生成技術（STCG）是盤古5.0版本推出的能力，其核心在于讓大模型生成不僅視覺上逼真、而且符合物理規律的駕駛視頻。與傳統仿真工具依賴游戲渲染引擎不同，STCG直接在模型內部嵌入了對空間結構和時間變化的建模，車輛在不同攝像頭視角之間的過渡是平滑的，在不同天氣和光照條件下行駛時，車輛行為也符合現實邏輯，如在雨天生成的視頻中，車輛會自動開啟尾燈。在HDC 2024的現場演示中，模型就生成了從空無一人街道到多車交匯復雜路況的場景，并在一鍵切換晴天與雨天時同步改變了車輛細節。

圖片源自：網絡

從技術實現上看，盤古在視頻生成大模型的VAE和DiT架構基礎上增加了3D邊界框編碼器、BEV路網編碼器和相機軌跡編碼器三個輸入模塊，通過對3D邊界框和BEV路網圖的聯合處理，可實現多視角關聯學習。其訓練數據采用了六個視角的攝像頭數據，累計采集和治理了20萬幀高質量數據，結合場景視頻生成、4D BEV視頻生成、自動駕駛仿真庫以及路網信息，STCG能夠大規模生成物理一致的駕駛視頻數據，并可靈活增加控制條件，定制化生成不同路況、光照和天氣的訓練數據。STCG還能生成隨機性、偶發性、對抗性場景，也就是自動駕駛開發中難以通過真實路采大量獲取的邊緣場景。

2）世界模型，從生成視頻到構建數字空間

盤古世界模型于2025年發布，其建立在多模態大模型的基礎之上，它的輸入量極小，在智能駕駛領域，只需輸入首幀行車場景、行車控制信息和路網數據，就能生成每路攝像頭的行車視頻和對應的激光雷達點云數據。換言之，從一個初始狀態出發，模型可以持續想象出接下來的整個駕駛過程，生成幀率達到每秒30幀的視頻續寫能力。

世界模型在自動駕駛領域的一個典型應用是復雜邊緣場景的重建，廣汽集團與華為云合作，基于盤古多模態大模型實現了2D視頻與3D點云數據在像素級別的精確對應，能夠在數分鐘內完成復雜場景的復原。廣汽在此基礎上還開發了神行仿真平臺，其可控視頻生成的幾何一致性提升了80%。由于傳統的仿真場景構建需要大量人工建模，而世界模型可以直接從有限輸入生成完整的仿真環境，供端到端自動駕駛模型進行迭代訓練，因此這種快速重建邊緣場景的能力，是傳統仿真工具難以實現的。

圖片源自：網絡

世界模型還展示了盤古在更廣泛物理模擬場景中的能力，在火星探測演示中，基于單張火星地表圖片，世界模型可生成高精度的數字物理空間，用于火星車的避障訓練和機械臂操作的模擬。盡管這與自動駕駛并不直接相關，但它反映了模型在多模態生成和物理規律建模方面的基礎能力。

在這里一定需要補充的是，仿真數據能否完全替代真實路采數據，業內仍然存在討論。仿真數據的分布偏差、模型在仿真環境中過擬合等問題尚未完全解決，但STCG和世界模型至少提供了一種增加數據多樣性、彌補真實數據稀缺性的方法，其價值在于幫助開發者更高效地覆蓋更多的邊緣場景，而不是完全取代真實路測。

八爪魚平臺，技術能力的工程化集成

盤古大模型的能力并非獨立存在的，而是通過華為云的八爪魚自動駕駛云服務平臺向車企和開發者開放。八爪魚是一個一站式的全托管自動駕駛開發平臺，整合了數據標注、模型訓練、仿真測試等環節的工具鏈。

圖片源自：網絡

在數據標注環節，盤古大模型提供了自動標注能力，支持2D、2.5D和3D的自動標注，據稱標注準確率超過90%。在場景理解能力上，模型能夠代替人工進行視頻片段的分類和標簽化處理，萬段視頻可以在分鐘級完成處理。在數據檢索方面，平臺支持以文搜圖、以圖搜圖等多模態檢索能力，可在百萬圖片庫中實現分鐘級檢索。

華為八爪魚自動駕駛云服務平臺還提供了并行仿真能力，可利用云端資源同時運行&zwnj;1000+仿真節點&zwnj;，實現&zwnj;日行千萬公里級&zwnj;的虛擬測試里程。平臺內置&zwnj;20萬+結構化仿真場景庫&zwnj;，并支持用戶通過&zwnj;自定義標簽體系與&zwnj;可編程評估腳本&zwnj;，靈活構建專屬的場景組合與測評指標，全面支撐車企高效驗證算法性能，加速自動駕駛功能量產落地。

值得一提的是，八爪魚平臺與盤古世界模型已經進行了深度整合，世界模型的視頻和點云多視角生成能力被直接用于端到端智駕模型的并行仿真，車企可以基于生成的仿真數據對模型進行快速迭代測試。據廣汽方面的數據，這種技術組合支撐了端到端模型兩天一個版本的迭代節奏，不過從行業通用標準來看，這種迭代速度更多反映的是在仿真環境中的模型調優效率，真實道路測試仍然需要按照安全規范逐級推進。

行業應用現狀與面臨的挑戰

從公開信息來看，盤古大模型在汽車行業的部署已有一定規模，華為云在2024年被沙利文評為中國汽車大模型市場領先者，已有超過300家汽車行業客戶采用其解決方案。一汽解放與華為基于盤古大模型開展了多個場景的驗證測試；華為云自動駕駛開發平臺已在長安、一汽、比亞迪、廣汽等多家車企以及礦用卡車、港口ART、專線物流重卡等商用車場景中部署。

圖片源自：網絡

在商用車領域，盤古大模型被用于自動駕駛算法的開發驗證和優化迭代，幫助降低測試成本和風險。不過這些合作項目大多仍處于驗證測試階段，距離大規模量產應用還有一定的距離。

在自動駕駛領域，仿真數據與真實數據之間的域差距一直是行業共同面對的問題，盡管STCG生成的視頻在視覺上接近真實，但仿真環境始終無法完全復制真實道路中所有不確定性因素，模型在仿真中表現良好不等于在實際道路中同樣可靠。此外，邊緣場景生成的邊界范圍也難以界定，生成的場景是否覆蓋了足夠多類型的危險情境，是否存在未被覆蓋的盲區，這些問題的驗證成本本身就很高。再者，盤古大模型的架構和部分技術細節尚未完全公開，行業對其技術水平的評估主要依賴華為官方發布的基準測試結果，第三方獨立驗證仍然有限。