百人牛牛河南省教育考试院公布的高考录取分数线,文科本科一批分数线为521。根据测试结果,这意味着,GPT-4o、豆包、文心4.0、百小应等四款AI大模型在测试中的得分冲上了“一本”线。
与文科相比,大模型的理科成绩要差很多,最高分还不到480分,多数大模型的理科总分在400分以下,数学普遍不及格,相比河南理科511分的“一本”线,大模型还需努力。
作为本次评测的语文作文阅卷人,北京市级骨干教师、怀柔区语文学科带头人夏老师曾多次参加全国高考语文阅卷。夏老师认为:“Al写出的文章大多有清晰完整的结构,有逻辑性,语言通顺流畅。但其理性有余,感性不足,缺乏感情色彩,自然就缺乏感染力。”
以数学试卷为例,9款大模型产品中,仅GPT-4o、文心一言4.0和豆包获得60分以上成绩(满分150分),目前的大模型只能正确推理步骤相对简单的问题。
在匿名阅卷中,豆包获得阅卷老师的好评:文章中显出的对就业结构、伦理方面的担心,展现出豆包已经具有不错的思想深度和思辨能力。
重点考查实验探究能力的化学和物理试卷,各模型平均分更是只有34分和39分(满分为100和110)。化学单项最高分由豆包获得,成绩为49.5分,GPT-4o仅有42分。
在历史和政治两科中,测试选手中有三至四家能达到80%以上的得分率。历史单科的桂冠归属豆包82.5的平均分。出乎意料的是,地理考试是文综三科中大模型表现最差的,最高分仅仅是 GPT-4o的68分。原因之一可能是地理涉及图片更多,AI识图能力有待提升。
大模型处理自然语言方面的能力不容置疑,三款国产大模型产品获得了语文考试前三名,分别是百小应、字节豆包和腾讯元宝,得分依次为128分、125.5分和120.5分。丢分主要在语文写作上。
具体看,在立住“问题”后,豆包随即用反问句自然过渡,引出三个排比段提出解决问题的方法。然后用发展的眼光分析问题,结合现实生活揭示问题产生的根源和危害的部分颇为亮点。
大模型在高考英语测试中的优势更是压倒性的。一张150分满分的英语卷子,平均分达到132分,其中客观题几乎都是满分或接近满分,丢分主要在应用文写作和读后续写的作文部分,表达空泛、缺少细节上是弊端。
如上提到,大模型理科普遍不行,成绩要差很多,在数学、物理、化学等数理学科上差距极大,包括GPT-4o在内的所有大模型都无法达到及格水平。大模型的理科最好成绩还无法进入人类考生的前30%。
177.58MB
查看456.30MB
查看18.3MB
查看236.44MB
查看269.41MB
查看112.21MB
查看420.40MB
查看246.84MB
查看584.14MB
查看738.71MB
查看803.38MB
查看439.43MB
查看720.55MB
查看783.21MB
查看980.96MB
查看908.83MB
查看304.51MB
查看203.80MB
查看618.15MB
查看611.64MB
查看274.25MB
查看950.61MB
查看748.11MB
查看852.82MB
查看754.21MB
查看922.26MB
查看653.93MB
查看906.63MB
查看141.27MB
查看243.96MB
查看964.23MB
查看340.79MB
查看783.44MB
查看502.73MB
查看623.54MB
查看863.28MB
查看198.99MB
查看416.35MB
查看638.58MB
查看959.54MB
查看481.41MB
查看324.45MB
查看274.16MB
查看715.71MB
查看797.99MB
查看883.48MB
查看260.77MB
查看939.97MB
查看208.96MB
查看348.82MB
查看308.37MB
查看864.93MB
查看707.78MB
查看930.67MB
查看954.86MB
查看993.72MB
查看841.58MB
查看847.92MB
查看312.39MB
查看873.38MB
查看979.88MB
查看516.26MB
查看622.22MB
查看915.13MB
查看290.35MB
查看527.99MB
查看938.81MB
查看637.99MB
查看417.62MB
查看271.90MB
查看879.40MB
查看687.93MB
查看894.57MB
查看212.69MB
查看243.55MB
查看338.60MB
查看432.72MB
查看157.49MB
查看590.42MB
查看974.51MB
查看910.28MB
查看343.18MB
查看752.85MB
查看564.46MB
查看702.12MB
查看348.64MB
查看589.51MB
查看617.68MB
查看860.95MB
查看719.67MB
查看237.90MB
查看721.70MB
查看648.25MB
查看774.37MB
查看805.26MB
查看569.76MB
查看533.76MB
查看433.90MB
查看213.68MB
查看563.69MB
查看921.20MB
查看380.76MB
查看979.94MB
查看365.56MB
查看
821齐齐哈尔jr
男子酒醒后竟被困18楼墙外🏣
2025-07-01 11:20:35 推荐
339188****4670
大妈忘记银行卡密码打拍子唱歌回忆🏧
2025-07-01 10:11:09 不推荐
931152****6474
预计5月生效!全球首个“AI法案”在欧盟获批,“威胁公民权利”的AI应用将被禁止🏫
2025-06-30 21:46:51 推荐
31直线赛马
2025-06-30 15:52:37 推荐