新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

訂閱
糾錯
加入自媒體

Anthropic交表,MiniMax沖A,而我最想聊的是M3大模型

Anthropic剛剛向美國SEC遞交了保密的招股書,一個萬億美元市值的IPO即將誕生——這也是迄今為止,AI產業規模最大的IPO。差不多同一時間,MiniMax開始沖刺A股上市。今年是人工智能的資本大年,也是技術和應用大年。歸根結底,是技術進步推動了AI商業化的加速發展,從而進一步推動了資本市場的樂觀情緒。這是本輪人工智能牛市與1990年代后期的互聯網泡沫最大的不同點!

整整兩個月以前,我跟一位在AI領域頗富經驗的投資人朋友喝茶,討論國產大模型公司的特點和戰略定位。在談到MiniMax時,我的觀點是:“應用層做得不錯,市場推廣也很好,海外應用尤其成功。但是在基礎模型技術上,似乎沒有特殊之處,讓我感覺不到特色。”出乎我意料的是,對方馬上進行了全方位的反駁,表示:“低估MiniMax的基礎模型實力,是很多人常犯的錯誤,尤其多見于資本市場。”當時他沒能說服我,但是留下了一個預言:“幾個月之內,你會重新審視對這家公司的技術水平的看法。”附帶說一句,我們的討論與資本市場的短期波動完全無關,當時如此,現在也是如此。

6月1日這一天,這件事情果然發生了:MiniMax M3大模型發布。不巧的是,在此前后,包括MiniMax在內的中國AI上市公司經歷了普遍的深度調整,導致在社交媒體上,對模型的討論基本讓位于對股價的討論(我對此深感遺憾)。而且由于今年以來,國產大模型更新頻率太快,熱門模型此起彼伏,很多人可能忽視了這個模型的特殊意義。但是對于AI編程以及Agentic Workflow的重度用戶來說,應該能迅速掂量出這個模型的分量:

具備強大的Coding/Agent Frontier能力;

具備1M Context Window(上下文窗口);

原生多模態能力,能理解圖像、視頻等多模態信息;

開源。

在國產大模型當中,MiniMax M3是第一個集齊了前三項(不妨稱之為“Frontier三件套”)的。一個多月前發布的DeepSeek V4是一個很優秀的模型、已經積累了大量用戶,但它是一個純文本模型,暫不具備原生多模態能力。很多國產大模型有多模態能力,但要么上下文窗口偏小,要么Coding能力不夠強,或者二者均有瑕疵(在此就不逐一點名分析了)。

而在全球范圍內,只有Claude Opus 4.8, GPT 5.5, Gemini 3.1等前沿大模型具備“Frontier三件套”,但是很可惜,它們都不開源。MiniMax M3是迄今為止出現過的Coding/Agent能力最強大、最全面的開源大模型,這不僅是我個人的觀點,也是許多專業評測者的觀點。“硅谷閉源模型 VS 國產開源模型”,這不僅是一種媒體或資本市場的敘事范式,更是板上釘釘的現實趨勢,而MiniMax M3的發布進一步確認了這一趨勢。

嗯,不妨更準確地說——“高價的硅谷閉源模型 VS 低價的國產開源模型”。國產大模型的Token定價一貫以價廉物美、量大管飽著稱,與十分昂貴的Claude形成了鮮明對比;而MiniMax M3的定價即便在國產大模型當中也是頗具競爭力的。就拿個人開發者的Token Plan付費方案來說,Max售價為每月119元人民幣,提供18億Token,相當于Claude Max 5x(每月100美元)容量的2倍,平均每100萬Token的售價僅為0.066元。MiniMax官方顯然認為,這樣的定價對當前的模型能力和使用場景是最適合的。

當然,需要承認的是,在尖端的Coding能力上,Claude仍然難以替代,這是它索取溢價的底氣。但是在大部分日常Agent Workflow當中,M3能夠以很高的性價比提供令人滿意的效果——大部分用戶需要的不就是這個嗎?在此援引知名AI技術大牛、Vercel CEO Guillermo Rauch的評論:“MiniMax M3……僅僅略遜于Opus & GPT5, 但是要便宜10倍。”(Right behind Opus & GPT5, but 10x cheaper.)

Artificial Analysis (AA)綜合智能指數排行榜,MiniMax M3位列全球第七,這也是開源模型的全球最高排名

短短半年之前,資本市場還在爭論“生成式AI什么時候才能跑通可持續的商業模式”。現在這已經不是問題了,因為已經跑通了,Anthropic剛剛遞交了招股書、今年二季度即將實現盈利,OpenAI也快了。大模型的所謂“Token經濟學”已經徹底建立起來了,賣Token成為了一門前途無量的生意,其核心推動力有二:第一是由OpenClaw推動的Agent風潮,第二是以Seedance, Happy Horse, Veo等為代表的視頻大模型熱潮。二者都具備很強的生產力屬性,都會消耗大量Token;更奇妙的是,用戶認為消耗的Token是值得的,買的越多,賺的就越多。雙贏的生意!

今年一季度,我認為MiniMax的Coding & Agent能力無足輕重,因此低估了它。然而,M3足以徹底讓包括我在內的所有人改變態度——與上一版本M2.7相比,它的進步是革命性的。在涵蓋軟件工程、終端執行等多個維度的國際權威Benchmark Test, 例如SWE-Bench Pro當中,M3達到了國際領先水平,甚至超過了GPT-5.5和Gemini 3.1 Pro,僅落后于Claude Opus 4.7。我注意到,哪怕是一些對MiniMax家的Coding能力持保留意見的評測者,也表示:“今后養龍蝦的任務完全可以交給M3去做。”

附帶說一句,專門為M3設計并與M3一起訓練的Coding Agent產品MiniMax Code,已經與M3在同一時間發布了。明眼人都知道,今年年初以來AI Coding & Agent的大火,只有一半歸功于基礎模型的進步,另一半則應歸功于Claude Code和GPT Codex這兩大工具的發布——它們標志著Vibe Coding真正進入了Agentic時代,AI不僅能生成代碼,還能像訓練有素的軟件工程師一樣徹底理解任務,建立、修改和維護真實的軟件系統。Vibe Coding的格局一打開,Token經濟學的前景就無人能質疑了,怪不得馬斯克的xAI要斥資600億美元收購Cursor,其實就是買一張Agent時代的門票。

做基礎模型難,做Agent也難,所以過去半年,雖然出現了多個有一定編程能力的國產大模型,但國產Coding Agent還是一片空白,開發者還得用Claude Code等第三方工具接入。換句話說,直到幾天前,國產AI Coding還處于“有模型、無Agent”的階段,在工具層面,大部分開發者直接接觸的仍然是海外先進Agent。這一次,MiniMax Code算是填補了一個空白。平心而論,這款工具目前還處于草創階段,還需要一個打磨產品功能、積累用戶基礎的爬坡過程。如果做得好,那么基礎模型+Agent工具可以發揮1+1>2的作用;做的不好也不是大問題,用戶仍然可以通過其他Coding Agent去操作M3以及后續版本的模型。我不是技術專家,對于MiniMax Code的未來就先不下結論了,未來幾個季度應該能看到端倪。

MiniMax M3的上下文窗口高達1M,這一點很重要,因為上下文窗口必須足夠長才能容納復雜的輸入輸出,大部分人都能理解。而原生多模態能力這一條很容易被人忽視。很多人會認為,國內有Seedance、可靈,國外有Veo、Luma,多模態賽道已經很擁擠了,MiniMax的原生多模態有什么特別的實用性嗎?如果是在過去,我恐怕也會提出同樣的問題;可是最近兩個月,我一直在做AI視頻行業的深度調研,對這個問題還是有點發言權的。

多模態是一個復雜的概念,既包括多模態內容的輸出,也包括對多模態輸入的理解。M3具備對圖像和視頻內容的理解能力,結合強大的Coding能力,就可以解鎖很多復雜的玩法——例如輸入一段游戲視頻,讓模型分析核心玩法,然后試圖編程復刻一個,或對其進行修改;又例如輸入一段監控錄像,規定什么樣的情況需要標記、示警,讓模型進行逐幀分析和標記;還有輸入一大堆參考圖像、參考動畫段落,讓模型總結人設和場景美術特點,乃至在此基礎之上做新的美術策劃案……

不要忘記,MiniMax還擁有文本、語音和視頻大模型,可以做到不同類型內容的互相輸入和生成。電影《阿嫲的情書》最近大火,同款情書成為了小紅書爆款內容,基于M3可以輕易做出“僑批生成器”。對于AI短劇制作者來說,這更是福音,把劇本文本、參考圖片和視頻一起扔進去作為Prompt,就可以直接生成復雜的視頻內容。M3超長的上下文窗口,則允許了創作者對視頻進行反復修改。時至今日,絕大部分AI短劇還需要專業工具包進行輔助創作,門檻比一般人想象的要高。前不久Google I/O大會發布的Omni多模態大模型,讓人看到了在一個對話窗口內直接完成全套創作任務的可能性;盡管目前與Omni還有功能上的差距,但是假以時日,或許MiniMax也能提供類似的可能性。

因此,Coding/Frontier能力、超長上下文窗口、原生多模態能力,三者構成了一個密不可分的整體,同時覆蓋了當前Token經濟學的兩個焦點——Coding & Agent以及視頻生成。在此基礎之上開源,則更加難能可貴,大幅擴張了開發者生態圈。我經常感嘆:硅谷的一線AI大廠,包括OpenAI和谷歌,早年都走過開源路線,可是技術越進步就越傾向于閉源;xAI一度將開源作為賣點,但是自從Grok 2.5以來也不再開源。時至今日,硅谷的開源大模型生態,也就剩下Meta的LLaMA系列、谷歌的Gemma系列以及OpenAI偶爾發布的幾個小參數模型了,它們普遍比前沿大模型至少落后半代。這真的符合AI的普惠原則嗎?

反觀中國,MiniMax, Qwen, Kimi, DeepSeek……的前沿大模型都有開源版本,M3更是全球第一個集齊“Frontier三件套”的開源模型。在X和Reddit等美國社交媒體上,我們到處可以看到吐槽:當硅谷廠商把自己最先進的大模型嚴防死守不開源時,中國廠商卻在以極其低廉的成本提供開源的前沿大模型。這究竟是單純的商業模式選擇不同,還是某種更深層次的不同?到底哪一方才代表了開放、平等、普惠的大趨勢?

對于這個問題,我同樣不敢妄下結論。我只能說:MiniMax M3是一個很好的模型,讓我很激動,希望它以及其他中國大模型廠商,能夠不斷做出類似的既強大、又開放、人人皆可負擔的大模型。我還想補充一句:以大模型為基礎的生成式AI對人類社會的改造是以十年乃至更長時間為單位的,因此我不贊成聚焦于資本市場的短期變化——每天、每星期,資本市場都會因為各種各樣的情緒而波動,但這并不影響基本面,尤其不影響基礎研發和科技進步的大方向。

       原文標題 : Anthropic交表,MiniMax沖A,而我最想聊的是M3大模型

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號