AWS S3 Vectors 全面上線：查詢延遲低于 100 毫秒

2026-01-06 17:26

來源： OFweek人工智能網

近日，AWS 正式宣布其云對象存儲服務 S3 Vectors 全面上線。

該服務原生支持向量數據的存儲與查詢。此次正式發布將單索引容量提升 40 倍，最高可容納 20 億條向量，并實現低于 100 毫秒的查詢延遲。

該服務于今年七月曾開放預覽。根據 AWS 披露，預覽期間用戶已創建超過 25 萬個向量索引，并累計處理逾 400 億條向量。預覽階段單索引上限為 5000 萬條向量，而AWS首席開發者 Sebastian Stromacq 表示：

“
現在單索引可支持高達 20 億條向量的存儲與檢索……用戶可將全部向量數據集整合至單一索引，無需再通過分片或復雜的聯合查詢邏輯管理多個小型索引。

此外，該服務提升了查詢性能：低頻查詢可在 1 秒內返回結果，高頻查詢延遲則控制在100毫秒以內，這對對話式 AI 等交互應用尤為有利。

官方數據顯示，單次查詢最多可獲取 100 條結果，增強了檢索增強生成（RAG）應用的上下文質量。寫入性能方面，單向量更新最高支持每秒 1000 次 PUT 操作，支持小批量高吞吐寫入，并能實時檢索來自多并發源的新數據。

儲存優先，節省成本

AWS 同時宣布兩項關鍵集成結束預覽、全面開放：用戶可將 S3 Vectors 用作 Amazon Bedrock 知識庫的向量存儲引擎；其與 Amazon OpenSearch 的集成也已正式上線，用戶可在使用 OpenSearch 進行搜索分析的同時，將 S3 Vectors 作為底層向量存儲層。

開發者 Jalaj Nautiyal 在 LinkedIn 發文評價：S3 Vectors 將向量搜索從“計算優先”模式轉變為“存儲優先”方案。這一“無服務器”轉型意味著用戶不再需要管理集群、容器或分片，可像處理普通S3對象一樣管理向量，輕松實現數十億向量的存儲。

成本方面，預計可將總擁有成本降低高達 90%，僅需支付 S3 存儲費用（成本較低）與查詢費用，無需承擔閑置計算資源開銷。

他進一步指出，對于 80% 的內部 RAG 應用與自主智能體場景，或許無需追求頂級配置的向量數據庫。一個可靠且容量無限的“后備箱”已足夠——S3正成為這樣的存在。

目前S3 Vectors已在14個AWS區域上線（預覽階段為5個）。服務定價基于三個維度計算：