在人工智能基礎設施浪潮中,算力芯片成為產業角力的新戰場。長期以來,英偉達憑借其強大的 GPU 生態牢牢占據主導地位,但如今也不得不面對挑戰。
就在剛剛,高通宣布推出其面向數據中心的AI 處理器系列——AI200和AI250,以“推理為主、成本下沉”為切入口,挑戰了英偉達的霸主地位。
高通表示,AI200 將于明年開始發貨,AI250 將于 2027 年開始發貨。兩款產品均可作為獨立組件或可添加到現有機器的卡式產品提供。
高通高級副總裁 Durga Malladi 在接受采訪時表示,這些處理器代表了公司產品線的自然演變。該公司已經開發了強大的基于設備的芯片陣容,現在希望擴展其面向人工智能數據中心的功能。
高通表示,AI200 和 AI250 憑借其內存容量和能效優勢而占據優勢。
高通為何出手?
長期以來,英偉達憑借其高性能GPU、龐大軟件生態、以及龐大的數據中心客戶群,在訓練與推理領域具備80%左右的市場份額。
相比之下,高通過去的核心業務集中在移動端及邊緣計算,其在數據中心特別是AI 推理服務器中的話語權非常有限。
隨著大模型時代的來臨、云端推理需求激增以及功耗成本成為重要變量,AI 硬件結構正在發生微妙變化:不僅訓練需求龐大,推理場景數量更多、功耗敏感、部署靈活。
在這種大趨勢下,高通看到了三個重要機遇:
推理市場增長空間大:相比訓練,推理模型更貼近落地應用、功耗成本更受關注。高通選擇從推理切入,規避與英偉達在訓練領域的正面交鋒。
成本與效率成為突破口:高性能GPU雖強,但伴隨高功耗、高投資門檻,設備迭代與部署成本不菲。高通強調其產品在“更低功耗、更低TCO”上的優勢。
已有生態基礎:高通在移動領域、邊緣 AI 積累了豐富的 NPU(Neural Processing Unit)技術,如其 Hexagon 系列。AI200/AI250 正是基于其移動端 NPU 技術演化。
戰略層面,高通也宣布與 HUMAIN(沙特公共投資基金支持的AI公司)等數據中心客戶完成合作意向,期望借助中東大型部署進擊全球。
技術與市場定位
高通此次推出的兩款芯片——AI200 與 AI250,分別預計于 2026 年 和 2027 年量產。
它們專注于“推理”(inference)場景,而非大規模訓練,這一點刻意區隔了英偉達主流以訓練為導向的 GPU 產品。
在技術上,AI200 支持高達 768 GB RAM 的配置,體現了數據中心級別的規模化部署能力。
而 AI250 預計將帶來“代際躍遷”的效率提升,強調更低功耗、更高能效比。
高通指出,其芯片支持在一個機架內最多 72 片芯片組成一臺服務器,與英偉達、AMD的數據中心服務器結構相似。
盡管強調推理路線,但 AI 芯片的訓練市場依然體量巨大,高通若想攫取更大份額仍需進入訓練環節或與訓練生態兼容。
除此之外,軟件生態與開發者支持仍是其劣勢。英偉達多年積累CUDA、TensorRT、軟件優化工具是其壁壘。高通需加快軟件生態構建。
參考資料:
https://www.wsj.com/tech/qualcomm-stock-surges-on-ai-chip-launch-cc7a4590?mod=hp_lead_pos4
https://www.theverge.com/news/807078/qualcomm-ai-chips-launch-hexagon-npus?utm_source=chatgpt.com