近期,一份流出的英偉達內部會議文件,揭示了云計算市場龍頭亞馬遜云服務(AWS)正面臨來自其重要客戶的成本質疑。
該文件顯示,美國銀行旗下的金融機構 Capital One 在與英偉達的會議中明確表達了對 AWS 云計算成本失控的擔憂,并正在積極尋求替代方案。這一事件并非孤例,它反映了在生成式人工智能(GenAI)工作負載激增的背景下,企業云支出策略正在發生深刻變化,長期主導市場的云巨頭面臨著來自新興力量與客戶成本控制訴求的雙重挑戰。
成本壓力與市場格局演變
根據文件內容,Capital One 由于對 GPU 和 AI 推理模型的需求不斷增長,預計其在 AWS 上的成本將很快失控。
客戶不滿的核心直指 AWS 的計費方式。新興的云服務商允許客戶按需租用 GPU 算力,并按實際使用量付費,這種模式非常適合需求波動大、追求極致效率的 AI 研發與應用場景。
而AWS等傳統巨頭長期采用的按資源時長(如按月、按年)計費的預留實例模式,雖然在穩定工作負載下可能有規模優勢,但在面對彈性極強的 AI 任務時,容易造成資源閑置和成本浪費。
為此,該公司與英偉達探討了兩種主要的替代路徑:一是構建自有的“人工智能工廠”(即內部數據中心),二是轉向專注于AI工作負載的“新型云”服務提供商。
市場數據佐證了這一趨勢的普遍性。咨詢公司 Synergy Research Group 的報告指出,AWS 的全球市場份額在 2022 年第二季度達到頂峰后持續緩慢下滑。與之形成對比的是,以 CoreWeave、Lambda、Crusoe 等為代表的“新型云”廠商正在崛起。
這些廠商通常提供更靈活、按需付費的GPU算力租賃服務,相較于 AWS 傳統的按時長計費模式,對成本敏感且波動性大的 AI 初創公司及項目更具吸引力。
同時,采用多云策略已成為企業控制支出的主流手段,加拿大皇家銀行資本市場的報告顯示,43% 的企業正在使用兩家以上的公有云服務提供商。
產業鏈博弈
作為 AI 硬件的核心供應方,英偉達積極與 CoreWeave、Lambda 等新型云廠商合作,其動機之一是減少對少數傳統云巨頭的過度依賴,拓寬其芯片的銷售渠道和市場影響力。
Capital One 討論的“人工智能工廠”方案,代表了大型企業另一種根本性的成本控制思路——將核心算力基礎設施內部化。
它意味著企業的云策略不再僅僅是“購買服務”,而是在購買公有云服務、采用專業新型云、以及自建私有云之間尋求最佳平衡的復雜決策。多云架構已成為常態,其目的不僅是防止供應商鎖定,更是為了優化成本與性能。AWS 是亞馬遜最重要的利潤引擎,貢獻了公司約 58% 的營業利潤。當前,AWS 正處在加大資本開支以追趕 AI 基礎設施建設的投資高峰期。
一方面,亞馬遜需要投入巨資建設數據中心和開發定制 AI 芯片(如Trainium3)以提升競爭力并承諾降低成本,另一方面又面臨來自各方的價格壓力。如何在這場平衡術中維持其市場領導地位和利潤率,是亞馬遜管理層面臨的核心挑戰。
對于 AWS 而言,真正的挑戰或許不僅來自微軟和谷歌的正面競爭,更來自于那些能夠提供更聚焦、更靈活、更經濟解決方案的新興力量。未來的云市場,注定是一個競爭更為激烈、選擇更為多元的戰場。
參考資料:
https://news.futunn.com/post/66725761/leaked-internal-documents-from-nvidia-reveal-that-due-to-the?level=2&data_ticket=1766116194545042
https://cloud.it168.com/a2025/1121/6906/000006906284.shtml
https://36kr.com/p/3334807385155842