用6大AI來考高考數(shù)學(xué)，能打多少分？哪一家最強(qiáng)？

2026-06-10 11:12

隨著AI爆火，很多人喜歡用AI來做題，檢驗(yàn)AI到底行不行。

之前很多人用AI，更多用來答高考的作文，看看寫的如何，但如今隨著AI進(jìn)化，大家更喜歡用AI來答一些理科題目。

而今年大家都說高考數(shù)學(xué)超級(jí)難，都說“數(shù)學(xué)一卷，喜提大專”。

那么如果用AI來做數(shù)學(xué)一卷，能得多少分，哪一家AI表現(xiàn)最強(qiáng)呢？

近日，有機(jī)構(gòu)將豆包、Deepseek、騰訊元寶、阿里千問、Gemini 3.1、GPT 5.5這6大國(guó)內(nèi)外頂尖AI，放在一起，進(jìn)行了一次大評(píng)測(cè)。

機(jī)構(gòu)將所有試題以原卷掃描圖片輸入，并且每一道題都是獨(dú)立作答，不給上下文提示，不準(zhǔn)聯(lián)網(wǎng)做答，只憑大模型本身的能力，嚴(yán)格按照高考閱卷標(biāo)準(zhǔn)評(píng)分。

那么結(jié)果如何呢？只能說在答題這一塊，AI比絕大多數(shù)的人類都強(qiáng)，可能超過了99.9%的人，因?yàn)楦呖贾心艽?50分?jǐn)?shù)學(xué)的人并不是很多的，但AI真的能

具體的結(jié)果如下圖所示，大家可以看到用AI來答題，在基本題這部分，幾乎都是滿分，不管哪一個(gè)AI，都沒太多例外。

只是在最后的一道壓軸題上，拉開了差距，像千問得到了滿分，所以最終它的總得分也最高，達(dá)到了150分。

其它的5大AI在最后一道題上，都沒有得到滿分。另外在部分填空題，選擇上，也有AI沒有答出來，但總體來講，還是相當(dāng)強(qiáng)的。

最強(qiáng)的是千問150分，再是Deepseek是145分，再是豆包141分，GPT5.5 140分，Gemini是139分，元寶是136分。

這個(gè)成績(jī)，應(yīng)該是秒殺了絕大多數(shù)的高考考生，并且從整體來看，還是國(guó)內(nèi)的AI做中國(guó)的數(shù)學(xué)題更強(qiáng)一些。

說真的，對(duì)于AI而言，這一次的考試，也是挺難的，因?yàn)樗鼈円茸R(shí)別出照片上的題，以及各種數(shù)學(xué)符號(hào)，還要理解題目的語意，各種復(fù)雜的排版，然后再一一做答，中間也不聯(lián)網(wǎng)。

而就算是這樣，AI們還是表現(xiàn)不俗，說明當(dāng)前AI在邏輯、推理等領(lǐng)域的能力，已經(jīng)超過了絕大多數(shù)的人，數(shù)學(xué)考試，其實(shí)比寫作文更難的。

原文標(biāo)題 : 用6大AI來考高考數(shù)學(xué)，能打多少分？哪一家最強(qiáng)？

聲明： 本文由入駐維科號(hào)的作者撰寫，觀點(diǎn)僅代表作者本人，不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題，請(qǐng)聯(lián)系舉報(bào)。

共0條評(píng)論，0人參與

立即登錄即可訪問所有OFweek服務(wù)

忘記密碼

其他方式

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

暫無評(píng)論

圖片新聞

新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区