新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

<ins id="nrlrb"></ins>

<td id="nrlrb"><tr id="nrlrb"></tr></td>

<noscript id="nrlrb"></noscript><td id="nrlrb"></td>

<source id="nrlrb"><optgroup id="nrlrb"></optgroup></source>

當前位置： OFweek 人工智能網 > 機器學習 > 正文

GPT5來了！奧特曼真聽勸，但我擔心的還是發生了......

2025-08-14 16:47

AI機器人茶館

兩年多的時間，無數次的預告，無數次的營銷。現在，GPT-5 終于來了！

這次，奧特曼是真聽勸了。以前的 OpenAI 模型命名，像什么 o1、o3、o4、mini、nano、pro...... 看著比奶茶菜單還亂。而現在，它們統一都是 GPT-5。看上去清爽了不少。

但是大家最期待的那種ChatGPT、Sora式的驚艷技術大突破，說實話，沒有......

這也是我所擔心的點。

1 介紹一下GPT-5

GPT-5 并不是一個單一模型，而是一個融合了多個模型的 “混血系統”。它背后有三種不同層次的模型：

日常應答模型：快、準、便宜，回答大多數問題

深度推理模型：專門解決難題

實時路由器：自動判斷該用哪個模型，根據你的問題類型、復雜度、是否需要工具來選擇

比如你說一句 “這個題請認真推理”，它就會切換到推理模型。用完配額之后，還有 mini 版本頂上。

這是 GPT-5 真正的殺手锏，代表它已經具備非常成熟的工具和模型調用能力。

API 端也很簡單，直接分成三個型號：

gpt-5（主力）

gpt-5-mini（輕量）

gpt-5-nano（極輕量）

每個型號還能設置 4 個推理等級。最特別的是增加了一個 “minimal模式”，不繞彎子、不浪費推理 token，直接提高響應速度。

此外，GPT-5 支持超長上下文，以及雙模輸入：

輸入上限：272,000 tokens

輸出上限（含推理 token）：128,000 tokens

支持“文本+圖片”輸入，輸出只支持文本

這意味著它能一口氣消化上百頁文檔，相當于一本巨著，還能邊看圖邊理解，再用相當長的篇幅給你答復。

2 GPT-5確實更聰明了

OpenAI說，GPT-5的推理能力提升了，還更誠實、更少幻覺，在寫作、編程、醫療等領域都比前代強。奧特曼自信地說：

“GPT-3有點像和高中生交談。GPT-4，也許就像和大學生交談一樣。但有了GPT-5，現在就像和一位專家交談，一位博士級別的專家，在任何你需要的領域，按需交流。”

聽起來很燃，但一些早期體驗者給出的評價是：它很穩，很能干，但不是質變。

特別是在寫作上，甚至有人覺得GPT-4.5的文字風格更貼近人類，而GPT-5偶爾還是會冒出“套話式”的流水文。

不過在編程方面，GPT-5的口碑倒是相當炸裂。

從一口氣生成整個網站，到精準解決復雜依賴沖突，它比任何前代模型都干脆利落，能用并行調用多個工具，像個人類程序員一樣干活。

OpenAI官網甚至展示了GPT-5生成的小游戲，直接可以玩的那種，以及對應Prompt。

下面我們看一下 GPT-5 的成績單：

數學：AIME 2025（無工具輔助）得分 94.6% 。

編程：SWEbench Verified 得分 74.9%，Aider Polyglot 得分 88% 。

多模態理解：在 MMMU 上取得 84.2% 。

健康領域：HealthBench Hard 得分 46.2% 。

經濟重要任務：在涵蓋法律、物流、銷售和工程等 40 多個職業的任務中，其表現優于 o3 和 ChatGPT Agent。

推理能力：在 GPQA（面向研究生水平的科學問題）上也創下新記錄，無工具情況下取得 88.4% 的高分。

3 價格打骨折

這次的定價直接開卷：

GPT-5：輸入 $1.25/百萬token；輸出 $10/百萬token

GPT-5 Mini：輸入 $0.25/百萬token；輸出 $2/百萬token

GPT-5 Nano：輸入 $0.05/百萬token；輸出 $0.4/百萬token

GPT-5 的價格比 GPT-4o 便宜一半，再加上90%的緩存折扣（短時間重復用相同輸入時），做AI產品的成本能省一大截。

和同類Claude、Gemini、Grok比起來，價格優勢明顯。OpenAI這是要赤裸裸地搶市場。

4 更安全可靠，從“拒絕”到“安全回答”

以前 AI 要么直接回答你，要么一句“抱歉不能回答”。

GPT-5 用了新的 safe-completions 策略：在安全政策范圍內盡量給出高層次、有用的答案，而不是簡單拒絕。

其他改進包括：

降低幻覺率：尤其是無聯網時的事實錯誤

減少諂媚傾向：通過獎勵機制減少它盲目迎合用戶

承認做不到：遇到無法完成的任務，會明確告訴你，而不是裝作完成了

在外部紅隊的 Prompt Injection 測試中，GPT-5-thinking 在攻擊成功率上只有 56.8%（k=10），明顯好于其他主流模型，但也說明這問題還沒解決，超過一半的多次嘗試仍然能突破防線。

5 GPT-5的發布時機

這次發布的時機非常 “奧特曼”：

谷歌剛發 Gemini Pro 1.5，他立刻甩出 GPT-5 搶頭條

一口氣覆蓋免費到 $200/月全價位用戶

同步進駐微軟全家桶（Copilot、Azure AI）

這不僅是技術迭代和價格戰，更是生態戰：讓所有用戶和開發者在 GPT-5 體系里閉環，不給競品留空間。

6 沒有突破性技術，AI進入瓶頸期？

別看這次 GPT-5 發布得聲勢浩大，價格表甩得啪啪響，性能數據擺得整整齊齊，但如果你把興奮勁壓下來，就會發現一個殘酷事實：

這次的內核，并沒有任何真正的 “質變”技術突破。

它的推理能力更強、上下文更大、工具用得更靈活，這些進步本質上都是在現有LLM架構下的堆料與優化。

而這恰恰暴露了一個可能讓整個行業都不安的信號：

我們是不是已經接近了這一代 AI 技術的 “天花板” ？

想想看，過去兩年里，AI 大模型的驚艷時刻幾乎都發生在 2022-2023：ChatGPT 橫空出世、GPT-4 讓人驚掉下巴、Stable Diffusion 把圖像生成送到民用級別、Midjourney 的畫風一度封神。

可到了 2024-2025，這些新品的“驚喜值”明顯下降，發布會更多是在講降價、整合、生態，而不是在炫耀什么 “完全新的智能范式”。

而且，目前大模型的訓練成本依然高得難以落地，性能提升卻越來越依賴于數據清洗、推理策略優化這種 “精裝修” 工作，而不是地基上的革命。

這可能意味著：

下一代質變可能需要全新的架構突破，而不是繼續把 Transformer 喂到天荒地老。

當前的 LLM，很可能已經到了一個短期內難以跨越的瓶頸期，我們不知道這個瓶頸會持續一年，還是五年。

換句話說，GPT-5 是一次優秀的迭代，但它的意義更像是 “蘋果把 iPhone 15 做到了極致”，而不是 “喬布斯第一次拿出 iPhone ”。

對于GPT-5，你是驚喜呢？還是失望呢？

歡迎在評論區討論！

原文標題 : GPT5來了！奧特曼真聽勸，但我擔心的還是發生了......

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權或其他問題，請聯系舉報。

發表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務

忘記密碼

其他方式

請輸入評論內容...

請輸入評論/評論長度6~500個字

暫無評論

暫無評論

圖片新聞

最新活動更多

6月30日
立即申請試用>> 【免費試用】旭之源工業電源一一機器人的穩定“心臟“
精彩回顧
立即查看>> 【限時免費】物理場仿真助力生物醫學領域技術創新
精彩回顧
立即查看>> 【直播】智測未來·2026海克斯康春季產品創新日
精彩回顧
立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會
精彩回顧
立即查看>> OFweek 2026（第十五屆）中國機器人產業大會
精彩回顧
立即查看>> 維科杯· OFweek 2025中國機器人行業年度評選

一周熱點月點擊榜

企業服務廣告服務獵頭服務薪酬報告

人工智能獵頭職位更多

高級軟件工程師廣東省/深圳市
自動化高級工程師廣東省/深圳市
光器件研發工程師福建省/福州市
銷售總監（光器件）北京市/海淀區
激光器高級銷售經理上海市/虹口區
光器件物理工程師北京市/海淀區
激光研發工程師北京市/昌平區
技術專家廣東省/江門市
封裝工程師北京市/海淀區
結構工程師廣東省/深圳市

掃碼關注公眾號
OFweek人工智能網
獲取更多精彩內容

文章糾錯

x

_*文字標題：

_*糾錯內容：

聯系郵箱：

_*驗證碼：

看不清，點擊換一張

粵公網安備 44030502002758號

<noscript id="1oljb"></noscript>

<style id="1oljb"><tbody id="1oljb"><dfn id="1oljb"></dfn></tbody></style>