GPT5來了!奧特曼真聽勸,但我擔心的還是發生了......
兩年多的時間,無數次的預告,無數次的營銷。現在,GPT-5 終于來了!
這次,奧特曼是真聽勸了。以前的 OpenAI 模型命名,像什么 o1、o3、o4、mini、nano、pro...... 看著比奶茶菜單還亂。而現在,它們統一都是 GPT-5。看上去清爽了不少。
但是大家最期待的那種ChatGPT、Sora式的驚艷技術大突破,說實話,沒有......
這也是我所擔心的點。
1 介紹一下GPT-5
GPT-5 并不是一個單一模型,而是一個融合了多個模型的 “混血系統”。它背后有三種不同層次的模型:
日常應答模型:快、準、便宜,回答大多數問題
深度推理模型:專門解決難題
實時路由器:自動判斷該用哪個模型,根據你的問題類型、復雜度、是否需要工具來選擇
比如你說一句 “這個題請認真推理”,它就會切換到推理模型。用完配額之后,還有 mini 版本頂上。
這是 GPT-5 真正的殺手锏,代表它已經具備非常成熟的工具和模型調用能力。
API 端也很簡單,直接分成三個型號:
gpt-5(主力)
gpt-5-mini(輕量)
gpt-5-nano(極輕量)
每個型號還能設置 4 個推理等級。最特別的是增加了一個 “minimal模式”,不繞彎子、不浪費推理 token,直接提高響應速度。

此外,GPT-5 支持超長上下文,以及雙模輸入:
輸入上限:272,000 tokens
輸出上限(含推理 token):128,000 tokens
支持“文本+圖片”輸入,輸出只支持文本
這意味著它能一口氣消化上百頁文檔,相當于一本巨著,還能邊看圖邊理解,再用相當長的篇幅給你答復。
2 GPT-5確實更聰明了
OpenAI說,GPT-5的推理能力提升了,還更誠實、更少幻覺,在寫作、編程、醫療等領域都比前代強。奧特曼自信地說:
“GPT-3有點像和高中生交談。GPT-4,也許就像和大學生交談一樣。但有了GPT-5,現在就像和一位專家交談,一位博士級別的專家,在任何你需要的領域,按需交流。”
聽起來很燃,但一些早期體驗者給出的評價是:它很穩,很能干,但不是質變。
特別是在寫作上,甚至有人覺得GPT-4.5的文字風格更貼近人類,而GPT-5偶爾還是會冒出“套話式”的流水文。
不過在編程方面,GPT-5的口碑倒是相當炸裂。

從一口氣生成整個網站,到精準解決復雜依賴沖突,它比任何前代模型都干脆利落,能用并行調用多個工具,像個人類程序員一樣干活。
OpenAI官網甚至展示了GPT-5生成的小游戲,直接可以玩的那種,以及對應Prompt。





下面我們看一下 GPT-5 的成績單:
數學:AIME 2025(無工具輔助)得分 94.6% 。

編程:SWEbench Verified 得分 74.9%,Aider Polyglot 得分 88% 。

多模態理解:在 MMMU 上取得 84.2% 。

健康領域:HealthBench Hard 得分 46.2% 。

經濟重要任務:在涵蓋法律、物流、銷售和工程等 40 多個職業的任務中,其表現優于 o3 和 ChatGPT Agent。

推理能力:在 GPQA(面向研究生水平的科學問題)上也創下新記錄,無工具情況下取得 88.4% 的高分。

3 價格打骨折
這次的定價直接開卷:
GPT-5:輸入 $1.25/百萬token;輸出 $10/百萬token
GPT-5 Mini:輸入 $0.25/百萬token;輸出 $2/百萬token
GPT-5 Nano:輸入 $0.05/百萬token;輸出 $0.4/百萬token

GPT-5 的價格比 GPT-4o 便宜一半,再加上90%的緩存折扣(短時間重復用相同輸入時),做AI產品的成本能省一大截。
和同類Claude、Gemini、Grok比起來,價格優勢明顯。OpenAI這是要赤裸裸地搶市場。
4 更安全可靠,從“拒絕”到“安全回答”
以前 AI 要么直接回答你,要么一句“抱歉不能回答”。
GPT-5 用了新的 safe-completions 策略:在安全政策范圍內盡量給出高層次、有用的答案,而不是簡單拒絕。
其他改進包括:
降低幻覺率:尤其是無聯網時的事實錯誤
減少諂媚傾向:通過獎勵機制減少它盲目迎合用戶
承認做不到:遇到無法完成的任務,會明確告訴你,而不是裝作完成了

在外部紅隊的 Prompt Injection 測試中,GPT-5-thinking 在攻擊成功率上只有 56.8%(k=10),明顯好于其他主流模型,但也說明這問題還沒解決,超過一半的多次嘗試仍然能突破防線。
5 GPT-5的發布時機
這次發布的時機非常 “奧特曼”:
谷歌剛發 Gemini Pro 1.5,他立刻甩出 GPT-5 搶頭條
一口氣覆蓋免費到 $200/月全價位用戶
同步進駐微軟全家桶(Copilot、Azure AI)

這不僅是技術迭代和價格戰,更是生態戰:讓所有用戶和開發者在 GPT-5 體系里閉環,不給競品留空間。
6 沒有突破性技術,AI進入瓶頸期?
別看這次 GPT-5 發布得聲勢浩大,價格表甩得啪啪響,性能數據擺得整整齊齊,但如果你把興奮勁壓下來,就會發現一個殘酷事實:
這次的內核,并沒有任何真正的 “質變”技術突破。
它的推理能力更強、上下文更大、工具用得更靈活,這些進步本質上都是在現有LLM架構下的堆料與優化。
而這恰恰暴露了一個可能讓整個行業都不安的信號:
我們是不是已經接近了這一代 AI 技術的 “天花板” ?
想想看,過去兩年里,AI 大模型的驚艷時刻幾乎都發生在 2022-2023:ChatGPT 橫空出世、GPT-4 讓人驚掉下巴、Stable Diffusion 把圖像生成送到民用級別、Midjourney 的畫風一度封神。
可到了 2024-2025,這些新品的“驚喜值”明顯下降,發布會更多是在講降價、整合、生態,而不是在炫耀什么 “完全新的智能范式”。
而且,目前大模型的訓練成本依然高得難以落地,性能提升卻越來越依賴于數據清洗、推理策略優化這種 “精裝修” 工作,而不是地基上的革命。
這可能意味著:
下一代質變可能需要全新的架構突破,而不是繼續把 Transformer 喂到天荒地老。
當前的 LLM,很可能已經到了一個短期內難以跨越的瓶頸期,我們不知道這個瓶頸會持續一年,還是五年。
換句話說,GPT-5 是一次優秀的迭代,但它的意義更像是 “蘋果把 iPhone 15 做到了極致”,而不是 “喬布斯第一次拿出 iPhone ”。
對于GPT-5,你是驚喜呢?還是失望呢?
歡迎在評論區討論!
原文標題 : GPT5來了!奧特曼真聽勸,但我擔心的還是發生了......
請輸入評論內容...
請輸入評論/評論長度6~500個字


分享













