GPT-5前菜！OpenAI最強(qiáng)模型o3上手：到底強(qiáng)在哪？

2025-04-18 09:39

用了 o3，對 GPT-5 更期待了。

最近 OpenAI 的活確實(shí)有點(diǎn)多。在 3 月底推出 GPT-4o 原生圖像生成再度火遍全球后，北京時(shí)間 4 月 15 日凌晨，OpenAI 又推出了全新 GPT-4.1 系列模型，替代舊款的 GPT-4 模型。

而就在今天（4 月 17 日）凌晨，OpenAI 如約繼續(xù)推出了兩款全新的 o 系列推理模型——o3、o4-mini，替代此前的 o1 和 o3-mini。更重要的是，o3、o4-mini 不僅擁有了更強(qiáng)大的推理能力，支持將圖像直接納入「思考過程」，還是首次能夠獨(dú)立使用全部 ChatGPT 工具的推理模型，被官方稱為：

「我們（OpenAI）迄今為止發(fā)布的最智能的模型，代表了 ChatGPT 能力的一次飛躍。」

飛不飛躍我們先按下不談，但有一點(diǎn)實(shí)在讓人在意。OpenAI CEO 山姆·奧爾特曼（Sam Altman）今年 2 月就在 X 平臺公開披露內(nèi)部的模型路線圖，指出 GPT-4.5（Orion）將是「OpenAI 最后一個(gè)非推理（思維鏈）模型」，還說之后的 GPT-5 將整合 GPT 系列和 o 系列模型：

「不再將 o3 作為獨(dú)立模型推出。」

截屏2025-04-17 下午4.02.25.jpeg

圖/ X

但現(xiàn)在來看，山姆·奧爾特曼當(dāng)時(shí)的承諾似乎一個(gè)都沒有兌現(xiàn)，OpenAI 不僅發(fā)布了新的 GPT-4.1 系列非推理模型，還獨(dú)立推出了 o3 推理模型。那還有一直活在傳聞的 GPT-5，我們真的能在今年夏天看到嗎？

OpenAI 又發(fā)一波模型，o3是最特別的一個(gè)

GPT-4.1 系列、o3、o4-mini 發(fā)布之前，關(guān)于 OpenAI 太多模型的吐槽其實(shí)就已經(jīng)甚囂塵上，不僅是普通 ChatGPT 用戶，也包括很多開發(fā)者，也認(rèn)為 OpenAI 的模型陣容讓人「選擇困難」。

好在，雖然過去兩天 OpenAI 又連發(fā)了好幾個(gè)新模型，但至少也同步砍掉了一些「舊模型」。在 GPT-4.1 正式推出后，OpenAI 就預(yù)告將于 4 月 30 日在 ChatGPT 全面下線 GPT-4 模型，同時(shí)還將在 API 中（面向開發(fā)者）棄用 GPT-4.5 預(yù)覽版。

作為通用基座模型，GPT-4.1 實(shí)際分為了旗艦版、mini 版、nano 版，支持高達(dá)百萬級 tokens 上下文，在性能、成本和速度上全面優(yōu)于目前最主力的 GPT-4o 系列模型，但目前僅面向開發(fā)者上線 API。

但如果說 GPT-4.1 代表了 OpenAI 的現(xiàn)在，o3 和 o4-mini，可能就代表了 OpenAI 的未來。作為 OpenAI 探索推理模型技術(shù)路線的最新成果，o3 和 o4-mini 率先在推理鏈（chain-of-thought）中真正納入圖像理解能力。

截屏2025-04-17 下午7.44.06.png

圖/ OpenAI

簡單來說，它不僅能識別信息，還能把這些視覺輸入納入思維過程，成為完整邏輯鏈的一部分。不同于 GPT-4o 這類多模態(tài)模型，GPT-4o 雖然能「看圖」，但更多是為了給出自然語言響應(yīng)，而 o3、o4-mini 的圖像處理是為了解決問題——它是推理的一環(huán)。

與此同時(shí)，作為官方認(rèn)證的最強(qiáng)模型——o3，還是第一個(gè)調(diào)用 ChatGPT 全部工具的推理模型，包括搜索網(wǎng)絡(luò)、Python、圖像生成、代碼解釋器、文件讀取等。并且在與 o1 相同的延遲和成本下，o3 在 ChatGPT 中實(shí)現(xiàn)了更高的性能。

但實(shí)際表現(xiàn)如何，還是上手體驗(yàn)才有結(jié)果。

OpenAI「最強(qiáng)推理模型」上手：名副其實(shí)

對于推理模型而言，推理能力自然是重中之重，先來一道倫理推理題，非常考驗(yàn)?zāi)Ｐ偷耐评砟芰Γ覀円矊Ρ攘?DeepSeek-R1 以及 Gemini-2.5-Pro 兩大頂尖模型。

但在揭曉回答之前，o3 最驚艷的就是思考過程推導(dǎo)的嚴(yán)謹(jǐn)和流暢，相比之下，DeepSeek-R1 的思考過程就顯得相當(dāng)冗長和重復(fù)，思考非常久，最終的回答卻很難令人滿意。

截屏2025-04-17 下午6.24.52.png

圖/雷科技

在 DeepSeek-R1 的回答中，實(shí)際只回答了「憤怒的原因」，而沒有回答出「崩潰的原因」。在 Gemini-2.5-Pro 的回答中，雖然更進(jìn)一步推理出了「女兒撒謊」這個(gè)因素，但也很難導(dǎo)致「父親崩潰」。

截屏2025-04-17 下午7.47.17.png

圖/雷科技

o3 則相當(dāng)完美地抓出「色盲」的關(guān)鍵判斷，進(jìn)一步根據(jù)生物遺傳知識推導(dǎo)出最終的解釋。這里還要一提的是，其實(shí) DeepSeek-R1 在思考過程中也提到了「色盲」這個(gè)點(diǎn)，但并沒有認(rèn)為有效的推導(dǎo)。

此外，o3 以及 o4-mini 的一大突破在于將視覺能力納入思維鏈之中，相比之前阿里推出的視覺推理模型 QVQ-Max 更進(jìn)了一步。

你可以上傳一張機(jī)場照片，它會識別出航站樓建筑、乘客流線和標(biāo)識系統(tǒng)，再結(jié)合你的問題完成空間動(dòng)線的規(guī)劃或問題診斷。這種「圖像不是輸入素材，而是參與推理的變量」的設(shè)計(jì)，也是過去 o 系列推理模型所不具備的。

更重要的是，它可以根據(jù)圖像實(shí)時(shí)思考分析策略。

比如最近 AI 行業(yè)非常關(guān)鍵的一件事，就是支付寶在前幾天聯(lián)合魔搭社區(qū)剛剛上線了支付 MCP Server 讓 AI 智能體打通了「變現(xiàn)」的支付環(huán)節(jié)。我就拿一段演示視頻發(fā)送給 o3，詢問「視頻里展示技術(shù)的關(guān)鍵之處」，甚至沒有告訴它任何背景信息。

截屏2025-04-17 下午7.05.57.png

圖/雷科技

而在實(shí)際測試中，o3 會提取不同時(shí)間的關(guān)鍵幀理解視頻，再結(jié)合自身分析推理和聯(lián)網(wǎng)能力，明確定位到了支付寶「支付 MCPServer」的，并且結(jié)合信息分析了支付寶「支付 MCPServer」的關(guān)鍵意義。

不僅如此，在一段關(guān)于短視頻優(yōu)化的測試中，o3 被要求分析后臺數(shù)據(jù)并結(jié)合視頻分鏡做優(yōu)化策略，輸出的內(nèi)容不僅覆蓋「3 秒留人、節(jié)奏剪輯、文案鉤子」等核心策略，還匹配了具體視覺節(jié)奏建議。

圖/雷科技

這點(diǎn)來看，o3 很像一個(gè)有一定審美和經(jīng)驗(yàn)的「專業(yè)創(chuàng)作者助手」，能針對實(shí)際的視頻內(nèi)容，而不是「簡單套模板」的自動(dòng)化建議。

而從這些測試也能看出，o3 懂得什么時(shí)候該分析、什么時(shí)候該搜索、什么時(shí)候該調(diào)用工具、什么時(shí)候該總結(jié)。而這種「主動(dòng)思維+執(zhí)行鏈條」，正是當(dāng)下大模型集體演進(jìn)的一個(gè)重要方向。

所以，它真的是 OpenAI 迄今為止最智能的模型嗎？從目前的體驗(yàn)來看，確實(shí)稱得上名副其實(shí)，甚至在不同推理模型的對比也是表現(xiàn)最強(qiáng)的。

寫在最后

用完 o3 最大的感受，你會覺得它在真正理解任務(wù)——而不只是理解你的意圖。在思考過程中能夠明顯看到這一點(diǎn)，同時(shí)還有 o3 在視覺理解、工具調(diào)用以及強(qiáng)大的推理能力。

也正因?yàn)槿绱耍猛?o3 后，那些關(guān)于 GPT-5 的想象也變得更具體了。

山姆·奧爾特曼明確說過，GPT-5 會整合 GPT 系列與 o 系列，而按照最新透露出的消息，GPT-5 的推出時(shí)間基本鎖定在今年夏天。按照時(shí)間來看，GPT-4.1/GPT-4.5 和 o3/o4-mini 很可能就是最后一代「獨(dú)立」模型，也是被「整合」的主力。

如果兩者真的融合，那會不會是一個(gè)既能讀百萬 tokens，又能跨模態(tài)行動(dòng)，還能自主調(diào)度工具進(jìn)行思維鏈的大一統(tǒng)模型？無論如何，這確實(shí)是未來幾個(gè)月 AI 行業(yè)最值得期待的懸念之一。

來源：雷科技

原文標(biāo)題 : GPT-5前菜！OpenAI最強(qiáng)模型o3上手：到底強(qiáng)在哪？

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點(diǎn)僅代表作者本人，不代表OFweek立場。如有侵權(quán)或其他問題，請聯(lián)系舉報(bào)。

發(fā)表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務(wù)

忘記密碼

其他方式

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

暫無評論

圖片新聞

新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

發(fā)表評論

登錄