2025 年,亞馬遜云科技(AWS)的re:Invent 大會不再局限于云計算領域的年度發布會,而是全面轉向 “AI全棧競爭” 的核心布局陣地。
從Trainium自研服務器芯片、自研大模型Nova 2、企業級訓練平臺Nova Forge到新一代AI Agent,AWS試圖用“自研芯片+云基礎設施+應用層AI”的組合拳,建立從底層到上層的閉環體系。
AWS CEO Matt Garman表示,Trainium的業務規模已達到數十億美元,并且迄今為止已經部署了100萬顆Trainium芯片。
可以看到,云計算廠商的競爭正在從算力規模走向AI能力結構的全面競賽。與此同時,微軟Azure、谷歌云等競爭者也在快速推進Agent、模型與基礎設施布局。各大廠商的資本開支呈現全面上漲態勢,這一趨勢正推動全球云計算市場進入新的加速期。
接下來,科技企業的底層創新,會如何改變云計算產業格局,云廠商的競爭將走向怎樣的長期路徑,都將是業界焦點。

在本屆re:Invent大會上,最受關注的是AWS迭代的一系列AI基礎設施能力。其中包括Trainium系列芯片、全新訓練服務器UltraServers、Nova 2系列基礎模型、Frontier Agents等等。
這些動作共同指向一個核心目標,即在眼下的AI浪潮中,AWS不再只是傳統云服務的提供者,而要成為從芯片到模型的AI全棧技術供應商。
首先是芯片層面的戰略,AWS主要有Graviton、Trainium、Inferentia三個系列。其中,Graviton是CPU芯片,主要對標英特爾;Trainium主打訓練,Inferentia主打推理,以AI芯片的標簽對標英偉達、AMD等。此次,AWS宣布了Trainium的進展,基于3nm AI芯片Trainium3推出了UltraServers。UltraServers單集群可以集成144顆芯片,算力達362PFLOPS(FP8),并且支持更高吞吐和更低能源成本。根據AWS披露的數據,相對于上一代產品,其性能提升超過4倍。
最新款的Trainium4芯片則將面向未來更大規模的模型訓練與推理場景。AWS推進自研芯片的意圖很明確,在全球GPU供應鏈緊張、成本不斷抬升的背景下,AWS需要掌握更可控的算力來源。
這使其與英偉達的關系呈現出典型的競合特點。一方面,AWS依舊是全球部署英偉達GPU規模最大的云廠商,最新推出的P6e-GB300實例,正是采用了英偉達GB300 NVL72 GPU的旗艦設備;另一方面,AWS自研芯片的加速推進,保障自有業務的同時,也在爭奪更多的算力市場空間。
這也反映了近年趨勢,云巨頭都在加碼芯片部署,不論AWS的AI芯片,還是谷歌的TPU,都已經從內部供應走向公開市場,和英偉達、AMD等的競合態勢愈演愈烈。
芯片之外,AWS在模型、企業級平臺上縱深布局,尤其是面向企業級市場發力。此前,AWS高管在接受21世紀經濟報道記者采訪中就談道,AWS的主張一直是企業需要多個模型,而不是一個模型。據悉,Amazon Bedrock新增18款開源模型,既包括谷歌Gemma 3、英偉達Nemotron、OpenAI和Mistral AI的模型;也包括國內的頭部大模型阿里Qwen3-NEXT和Qwen3-VL、月之暗面Kimi K2 Thinking、稀宇科技MiniMax M2。
同時,AWS還發布了4款的Nova 2系列模型,與之匹配的Nova Forge服務,則允許企業將自身數據整合進模型訓練流程,從而構建“企業知識 + 基礎模型”的專屬能力。
面向企業端,AWS甚至推出了AI Factories服務,為客戶定制AI設施。隨著AI進入千行百業,以AWS為代表的云廠商,正在重塑自身的“AI基建”護城河。
基礎能力競爭加劇的同時,全球云計算巨頭們還把目光轉向了Agent應用端。在業內人士看來,2025年是AI Agent(AI智能體)爆發元年,底層的硬件廠商,也開始往AI應用靠攏。
AWS發布了Frontier Agents系列,包括面向運維的DevOps Agent、安全場景的Security Agent、開發工作流程的Transform Custom以及復雜編程的Kiro Autonomous Agent。
這類Agent在人機對話基礎上,主要負責自動執行企業內部流程、調度云資源、處理故障,甚至做出策略判斷。它們也反映了AWS的一個策略,通過AI和自動化提升企業對云資源的依賴度,擴大整體云生態規模。
與AWS的“基礎設施型Agent”相比,OpenAI的Agent更適用于知識工作和個人效率工具;谷歌的Gemini Agent優勢在于檢索、內容生成以及與Workspace的結合;微軟的Copilot Agents作為生產力入口,深度綁定Office、Teams和Windows,在企業協作場景滲透;面向應用側,近期阿里千問APP公測版上線,全力進軍C端AI應用,進一步豐富AI的產品線。
而各式各樣的Agent、智能體、AI應用紛紛上線,只是新一輪AI云生態競爭的“前哨戰”。
真正的競爭正在從單純的云計算,轉向AI計算和AI生態。生成式AI推動算力需求爆炸式增長,大模型訓練、Agent長時間運行、多云互聯,都使云廠商必須具備多樣化能力。
放眼望去,從芯片、硬件、軟件到應用,巨頭們都已經集齊,并且在持續鞏固長板、補短板。每一年廠商都在進化,每一年市場都在重新排位,格局未定之際,大家繼續猛烈投資。
從海外云廠 商資本開支看,亞馬遜、微軟、谷歌、meta均在2025年大幅加碼資本開支,合計指引投入超3000億美元,主要用于服務器、數據中心等基礎設施投資。