新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

訂閱
糾錯(cuò)
加入自媒體

用6大AI來考高考數(shù)學(xué),能打多少分?哪一家最強(qiáng)?

隨著AI爆火,很多人喜歡用AI來做題,檢驗(yàn)AI到底行不行。

之前很多人用AI,更多用來答高考的作文,看看寫的如何,但如今隨著AI進(jìn)化,大家更喜歡用AI來答一些理科題目。

而今年大家都說高考數(shù)學(xué)超級(jí)難,都說“數(shù)學(xué)一卷,喜提大專”。

圖片

那么如果用AI來做數(shù)學(xué)一卷,能得多少分,哪一家AI表現(xiàn)最強(qiáng)呢?

近日,有機(jī)構(gòu)將豆包、Deepseek、騰訊元寶、阿里千問、Gemini 3.1、GPT 5.5這6大國(guó)內(nèi)外頂尖AI,放在一起,進(jìn)行了一次大評(píng)測(cè)。

機(jī)構(gòu)將所有試題以原卷掃描圖片輸入,并且每一道題都是獨(dú)立作答,不給上下文提示,不準(zhǔn)聯(lián)網(wǎng)做答,只憑大模型本身的能力,嚴(yán)格按照高考閱卷標(biāo)準(zhǔn)評(píng)分。

圖片

那么結(jié)果如何呢?只能說在答題這一塊,AI比絕大多數(shù)的人類都強(qiáng),可能超過了99.9%的人,因?yàn)楦呖贾心艽?50分?jǐn)?shù)學(xué)的人并不是很多的,但AI真的能

具體的結(jié)果如下圖所示,大家可以看到用AI來答題,在基本題這部分,幾乎都是滿分,不管哪一個(gè)AI,都沒太多例外。

圖片

只是在最后的一道壓軸題上,拉開了差距,像千問得到了滿分,所以最終它的總得分也最高,達(dá)到了150分。

其它的5大AI在最后一道題上,都沒有得到滿分。另外在部分填空題,選擇上,也有AI沒有答出來,但總體來講,還是相當(dāng)強(qiáng)的。

圖片

最強(qiáng)的是千問150分,再是Deepseek是145分,再是豆包141分,GPT5.5 140分,Gemini是139分,元寶是136分。

這個(gè)成績(jī),應(yīng)該是秒殺了絕大多數(shù)的高考考生,并且從整體來看,還是國(guó)內(nèi)的AI做中國(guó)的數(shù)學(xué)題更強(qiáng)一些。

圖片

說真的,對(duì)于AI而言,這一次的考試,也是挺難的,因?yàn)樗鼈円茸R(shí)別出照片上的題,以及各種數(shù)學(xué)符號(hào),還要理解題目的語意,各種復(fù)雜的排版,然后再一一做答,中間也不聯(lián)網(wǎng)。

而就算是這樣,AI們還是表現(xiàn)不俗,說明當(dāng)前AI在邏輯、推理等領(lǐng)域的能力,已經(jīng)超過了絕大多數(shù)的人,數(shù)學(xué)考試,其實(shí)比寫作文更難的。

       原文標(biāo)題 : 用6大AI來考高考數(shù)學(xué),能打多少分?哪一家最強(qiáng)?

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)