Anthropic交表，MiniMax沖A，而我最想聊的是M3大模型

2026-06-08 14:48

Anthropic剛剛向美國SEC遞交了保密的招股書，一個萬億美元市值的IPO即將誕生——這也是迄今為止，AI產業規模最大的IPO。差不多同一時間，MiniMax開始沖刺A股上市。今年是人工智能的資本大年，也是技術和應用大年。歸根結底，是技術進步推動了AI商業化的加速發展，從而進一步推動了資本市場的樂觀情緒。這是本輪人工智能牛市與1990年代后期的互聯網泡沫最大的不同點！

整整兩個月以前，我跟一位在AI領域頗富經驗的投資人朋友喝茶，討論國產大模型公司的特點和戰略定位。在談到MiniMax時，我的觀點是：“應用層做得不錯，市場推廣也很好，海外應用尤其成功。但是在基礎模型技術上，似乎沒有特殊之處，讓我感覺不到特色。”出乎我意料的是，對方馬上進行了全方位的反駁，表示：“低估MiniMax的基礎模型實力，是很多人常犯的錯誤，尤其多見于資本市場。”當時他沒能說服我，但是留下了一個預言：“幾個月之內，你會重新審視對這家公司的技術水平的看法。”附帶說一句，我們的討論與資本市場的短期波動完全無關，當時如此，現在也是如此。

6月1日這一天，這件事情果然發生了：MiniMax M3大模型發布。不巧的是，在此前后，包括MiniMax在內的中國AI上市公司經歷了普遍的深度調整，導致在社交媒體上，對模型的討論基本讓位于對股價的討論（我對此深感遺憾）。而且由于今年以來，國產大模型更新頻率太快，熱門模型此起彼伏，很多人可能忽視了這個模型的特殊意義。但是對于AI編程以及Agentic Workflow的重度用戶來說，應該能迅速掂量出這個模型的分量：

具備強大的Coding/Agent Frontier能力；

具備1M Context Window（上下文窗口）；

原生多模態能力，能理解圖像、視頻等多模態信息；

開源。

在國產大模型當中，MiniMax M3是第一個集齊了前三項（不妨稱之為“Frontier三件套”）的。一個多月前發布的DeepSeek V4是一個很優秀的模型、已經積累了大量用戶，但它是一個純文本模型，暫不具備原生多模態能力。很多國產大模型有多模態能力，但要么上下文窗口偏小，要么Coding能力不夠強，或者二者均有瑕疵（在此就不逐一點名分析了）。

而在全球范圍內，只有Claude Opus 4.8, GPT 5.5, Gemini 3.1等前沿大模型具備“Frontier三件套”，但是很可惜，它們都不開源。MiniMax M3是迄今為止出現過的Coding/Agent能力最強大、最全面的開源大模型，這不僅是我個人的觀點，也是許多專業評測者的觀點。“硅谷閉源模型 VS 國產開源模型”，這不僅是一種媒體或資本市場的敘事范式，更是板上釘釘的現實趨勢，而MiniMax M3的發布進一步確認了這一趨勢。

嗯，不妨更準確地說——“高價的硅谷閉源模型 VS 低價的國產開源模型”。國產大模型的Token定價一貫以價廉物美、量大管飽著稱，與十分昂貴的Claude形成了鮮明對比；而MiniMax M3的定價即便在國產大模型當中也是頗具競爭力的。就拿個人開發者的Token Plan付費方案來說，Max售價為每月119元人民幣，提供18億Token，相當于Claude Max 5x（每月100美元）容量的2倍，平均每100萬Token的售價僅為0.066元。MiniMax官方顯然認為，這樣的定價對當前的模型能力和使用場景是最適合的。

當然，需要承認的是，在尖端的Coding能力上，Claude仍然難以替代，這是它索取溢價的底氣。但是在大部分日常Agent Workflow當中，M3能夠以很高的性價比提供令人滿意的效果——大部分用戶需要的不就是這個嗎？在此援引知名AI技術大牛、Vercel CEO Guillermo Rauch的評論：“MiniMax M3……僅僅略遜于Opus & GPT5, 但是要便宜10倍。”(Right behind Opus & GPT5, but 10x cheaper.)

Artificial Analysis (AA)綜合智能指數排行榜，MiniMax M3位列全球第七，這也是開源模型的全球最高排名

短短半年之前，資本市場還在爭論“生成式AI什么時候才能跑通可持續的商業模式”。現在這已經不是問題了，因為已經跑通了，Anthropic剛剛遞交了招股書、今年二季度即將實現盈利，OpenAI也快了。大模型的所謂“Token經濟學”已經徹底建立起來了，賣Token成為了一門前途無量的生意，其核心推動力有二：第一是由OpenClaw推動的Agent風潮，第二是以Seedance, Happy Horse, Veo等為代表的視頻大模型熱潮。二者都具備很強的生產力屬性，都會消耗大量Token；更奇妙的是，用戶認為消耗的Token是值得的，買的越多，賺的就越多。雙贏的生意！

今年一季度，我認為MiniMax的Coding & Agent能力無足輕重，因此低估了它。然而，M3足以徹底讓包括我在內的所有人改變態度——與上一版本M2.7相比，它的進步是革命性的。在涵蓋軟件工程、終端執行等多個維度的國際權威Benchmark Test, 例如SWE-Bench Pro當中，M3達到了國際領先水平，甚至超過了GPT-5.5和Gemini 3.1 Pro，僅落后于Claude Opus 4.7。我注意到，哪怕是一些對MiniMax家的Coding能力持保留意見的評測者，也表示：“今后養龍蝦的任務完全可以交給M3去做。”

附帶說一句，專門為M3設計并與M3一起訓練的Coding Agent產品MiniMax Code，已經與M3在同一時間發布了。明眼人都知道，今年年初以來AI Coding & Agent的大火，只有一半歸功于基礎模型的進步，另一半則應歸功于Claude Code和GPT Codex這兩大工具的發布——它們標志著Vibe Coding真正進入了Agentic時代，AI不僅能生成代碼，還能像訓練有素的軟件工程師一樣徹底理解任務，建立、修改和維護真實的軟件系統。Vibe Coding的格局一打開，Token經濟學的前景就無人能質疑了，怪不得馬斯克的xAI要斥資600億美元收購Cursor，其實就是買一張Agent時代的門票。

做基礎模型難，做Agent也難，所以過去半年，雖然出現了多個有一定編程能力的國產大模型，但國產Coding Agent還是一片空白，開發者還得用Claude Code等第三方工具接入。換句話說，直到幾天前，國產AI Coding還處于“有模型、無Agent”的階段，在工具層面，大部分開發者直接接觸的仍然是海外先進Agent。這一次，MiniMax Code算是填補了一個空白。平心而論，這款工具目前還處于草創階段，還需要一個打磨產品功能、積累用戶基礎的爬坡過程。如果做得好，那么基礎模型+Agent工具可以發揮1+1>2的作用；做的不好也不是大問題，用戶仍然可以通過其他Coding Agent去操作M3以及后續版本的模型。我不是技術專家，對于MiniMax Code的未來就先不下結論了，未來幾個季度應該能看到端倪。

MiniMax M3的上下文窗口高達1M，這一點很重要，因為上下文窗口必須足夠長才能容納復雜的輸入輸出，大部分人都能理解。而原生多模態能力這一條很容易被人忽視。很多人會認為，國內有Seedance、可靈，國外有Veo、Luma，多模態賽道已經很擁擠了，MiniMax的原生多模態有什么特別的實用性嗎？如果是在過去，我恐怕也會提出同樣的問題；可是最近兩個月，我一直在做AI視頻行業的深度調研，對這個問題還是有點發言權的。

多模態是一個復雜的概念，既包括多模態內容的輸出，也包括對多模態輸入的理解。M3具備對圖像和視頻內容的理解能力，結合強大的Coding能力，就可以解鎖很多復雜的玩法——例如輸入一段游戲視頻，讓模型分析核心玩法，然后試圖編程復刻一個，或對其進行修改；又例如輸入一段監控錄像，規定什么樣的情況需要標記、示警，讓模型進行逐幀分析和標記；還有輸入一大堆參考圖像、參考動畫段落，讓模型總結人設和場景美術特點，乃至在此基礎之上做新的美術策劃案……

不要忘記，MiniMax還擁有文本、語音和視頻大模型，可以做到不同類型內容的互相輸入和生成。電影《阿嫲的情書》最近大火，同款情書成為了小紅書爆款內容，基于M3可以輕易做出“僑批生成器”。對于AI短劇制作者來說，這更是福音，把劇本文本、參考圖片和視頻一起扔進去作為Prompt，就可以直接生成復雜的視頻內容。M3超長的上下文窗口，則允許了創作者對視頻進行反復修改。時至今日，絕大部分AI短劇還需要專業工具包進行輔助創作，門檻比一般人想象的要高。前不久Google I/O大會發布的Omni多模態大模型，讓人看到了在一個對話窗口內直接完成全套創作任務的可能性；盡管目前與Omni還有功能上的差距，但是假以時日，或許MiniMax也能提供類似的可能性。

因此，Coding/Frontier能力、超長上下文窗口、原生多模態能力，三者構成了一個密不可分的整體，同時覆蓋了當前Token經濟學的兩個焦點——Coding & Agent以及視頻生成。在此基礎之上開源，則更加難能可貴，大幅擴張了開發者生態圈。我經常感嘆：硅谷的一線AI大廠，包括OpenAI和谷歌，早年都走過開源路線，可是技術越進步就越傾向于閉源；xAI一度將開源作為賣點，但是自從Grok 2.5以來也不再開源。時至今日，硅谷的開源大模型生態，也就剩下Meta的LLaMA系列、谷歌的Gemma系列以及OpenAI偶爾發布的幾個小參數模型了，它們普遍比前沿大模型至少落后半代。這真的符合AI的普惠原則嗎？

反觀中國，MiniMax, Qwen, Kimi, DeepSeek……的前沿大模型都有開源版本，M3更是全球第一個集齊“Frontier三件套”的開源模型。在X和Reddit等美國社交媒體上，我們到處可以看到吐槽：當硅谷廠商把自己最先進的大模型嚴防死守不開源時，中國廠商卻在以極其低廉的成本提供開源的前沿大模型。這究竟是單純的商業模式選擇不同，還是某種更深層次的不同？到底哪一方才代表了開放、平等、普惠的大趨勢？

對于這個問題，我同樣不敢妄下結論。我只能說：MiniMax M3是一個很好的模型，讓我很激動，希望它以及其他中國大模型廠商，能夠不斷做出類似的既強大、又開放、人人皆可負擔的大模型。我還想補充一句：以大模型為基礎的生成式AI對人類社會的改造是以十年乃至更長時間為單位的，因此我不贊成聚焦于資本市場的短期變化——每天、每星期，資本市場都會因為各種各樣的情緒而波動，但這并不影響基本面，尤其不影響基礎研發和科技進步的大方向。

原文標題 : Anthropic交表，MiniMax沖A，而我最想聊的是M3大模型