以数学试卷为例,9款大模型产品中,仅GPT-4o、文心一言4.0和豆包获得60分以上成绩(满分150分),目前的大模型只能正确推理步骤相对简单的问题。
在匿名阅卷中,豆包获得阅卷老师的好评:文章中显出的对就业结构、伦理方面的担心,展现出豆包已经具有不错的思想深度和思辨能力。
与文科相比,大模型的理科成绩要差很多,最高分还不到480分,多数大模型的理科总分在400分以下,数学普遍不及格,相比河南理科511分的“一本”线,大模型还需努力。
在历史和政治两科中,测试选手中有三至四家能达到80%以上的得分率。历史单科的桂冠归属豆包82.5的平均分。出乎意料的是,地理考试是文综三科中大模型表现最差的,最高分仅仅是 GPT-4o的68分。原因之一可能是地理涉及图片更多,AI识图能力有待提升。
重点考查实验探究能力的化学和物理试卷,各模型平均分更是只有34分和39分(满分为100和110)。化学单项最高分由豆包获得,成绩为49.5分,GPT-4o仅有42分。
作为本次评测的语文作文阅卷人,北京市级骨干教师、怀柔区语文学科带头人夏老师曾多次参加全国高考语文阅卷。夏老师认为:“Al写出的文章大多有清晰完整的结构,有逻辑性,语言通顺流畅。但其理性有余,感性不足,缺乏感情色彩,自然就缺乏感染力。”
大模型处理自然语言方面的能力不容置疑,三款国产大模型产品获得了语文考试前三名,分别是百小应、字节豆包和腾讯元宝,得分依次为128分、125.5分和120.5分。丢分主要在语文写作上。
大模型在高考英语测试中的优势更是压倒性的。一张150分满分的英语卷子,平均分达到132分,其中客观题几乎都是满分或接近满分,丢分主要在应用文写作和读后续写的作文部分,表达空泛、缺少细节上是弊端。
大发0234欢迎您河南省教育考试院公布的高考录取分数线,文科本科一批分数线为521。根据测试结果,这意味着,GPT-4o、豆包、文心4.0、百小应等四款AI大模型在测试中的得分冲上了“一本”线。
如上提到,大模型理科普遍不行,成绩要差很多,在数学、物理、化学等数理学科上差距极大,包括GPT-4o在内的所有大模型都无法达到及格水平。大模型的理科最好成绩还无法进入人类考生的前30%。
具体看,在立住“问题”后,豆包随即用反问句自然过渡,引出三个排比段提出解决问题的方法。然后用发展的眼光分析问题,结合现实生活揭示问题产生的根源和危害的部分颇为亮点。
135.12MB
查看947.88MB
查看40.2MB
查看646.66MB
查看623.26MB
查看447.48MB
查看549.35MB
查看908.58MB
查看406.33MB
查看472.19MB
查看552.67MB
查看664.36MB
查看189.99MB
查看459.79MB
查看851.31MB
查看265.23MB
查看793.61MB
查看542.25MB
查看250.98MB
查看368.35MB
查看367.61MB
查看693.51MB
查看975.60MB
查看533.99MB
查看784.22MB
查看619.70MB
查看303.15MB
查看215.33MB
查看115.37MB
查看138.86MB
查看249.97MB
查看450.55MB
查看667.16MB
查看952.92MB
查看587.23MB
查看356.45MB
查看445.87MB
查看437.84MB
查看342.42MB
查看589.10MB
查看544.30MB
查看212.14MB
查看805.28MB
查看735.77MB
查看509.89MB
查看212.32MB
查看689.76MB
查看313.85MB
查看812.54MB
查看898.43MB
查看349.58MB
查看515.12MB
查看319.47MB
查看649.32MB
查看266.33MB
查看347.57MB
查看238.89MB
查看250.16MB
查看384.38MB
查看919.75MB
查看236.56MB
查看251.31MB
查看253.98MB
查看984.26MB
查看976.60MB
查看159.13MB
查看927.89MB
查看730.82MB
查看862.28MB
查看641.85MB
查看533.70MB
查看252.41MB
查看368.88MB
查看628.74MB
查看174.39MB
查看916.26MB
查看164.99MB
查看736.82MB
查看189.92MB
查看142.73MB
查看686.67MB
查看781.23MB
查看736.88MB
查看437.19MB
查看106.70MB
查看797.97MB
查看528.89MB
查看328.50MB
查看448.13MB
查看113.94MB
查看537.32MB
查看808.83MB
查看496.19MB
查看673.58MB
查看990.24MB
查看231.21MB
查看899.17MB
查看171.30MB
查看177.95MB
查看334.66MB
查看746.67MB
查看194.34MB
查看969.78MB
查看805.74MB
查看
824福安st
伊朗官员:参与袭击伊朗东南部的恐怖分子已被全部击毙🌚
2025-06-23 10:32:47 推荐
419188****3881
日本水俣病受害者团体因索赔诉求被驳回提出上诉🌞
2025-06-25 22:06:47 不推荐
539152****1373
以色列战时内阁成员吁提前选举以“重建信任”🌤
2025-06-24 03:00:41 推荐
67水上划艇
2025-06-25 17:11:11 推荐