具体看,在立住“问题”后,豆包随即用反问句自然过渡,引出三个排比段提出解决问题的方法。然后用发展的眼光分析问题,结合现实生活揭示问题产生的根源和危害的部分颇为亮点。
在匿名阅卷中,豆包获得阅卷老师的好评:文章中显出的对就业结构、伦理方面的担心,展现出豆包已经具有不错的思想深度和思辨能力。
重点考查实验探究能力的化学和物理试卷,各模型平均分更是只有34分和39分(满分为100和110)。化学单项最高分由豆包获得,成绩为49.5分,GPT-4o仅有42分。
大模型在高考英语测试中的优势更是压倒性的。一张150分满分的英语卷子,平均分达到132分,其中客观题几乎都是满分或接近满分,丢分主要在应用文写作和读后续写的作文部分,表达空泛、缺少细节上是弊端。
以数学试卷为例,9款大模型产品中,仅GPT-4o、文心一言4.0和豆包获得60分以上成绩(满分150分),目前的大模型只能正确推理步骤相对简单的问题。
作为本次评测的语文作文阅卷人,北京市级骨干教师、怀柔区语文学科带头人夏老师曾多次参加全国高考语文阅卷。夏老师认为:“Al写出的文章大多有清晰完整的结构,有逻辑性,语言通顺流畅。但其理性有余,感性不足,缺乏感情色彩,自然就缺乏感染力。”
与文科相比,大模型的理科成绩要差很多,最高分还不到480分,多数大模型的理科总分在400分以下,数学普遍不及格,相比河南理科511分的“一本”线,大模型还需努力。
大模型处理自然语言方面的能力不容置疑,三款国产大模型产品获得了语文考试前三名,分别是百小应、字节豆包和腾讯元宝,得分依次为128分、125.5分和120.5分。丢分主要在语文写作上。
如上提到,大模型理科普遍不行,成绩要差很多,在数学、物理、化学等数理学科上差距极大,包括GPT-4o在内的所有大模型都无法达到及格水平。大模型的理科最好成绩还无法进入人类考生的前30%。
大众棋牌唯一官方网河南省教育考试院公布的高考录取分数线,文科本科一批分数线为521。根据测试结果,这意味着,GPT-4o、豆包、文心4.0、百小应等四款AI大模型在测试中的得分冲上了“一本”线。
在历史和政治两科中,测试选手中有三至四家能达到80%以上的得分率。历史单科的桂冠归属豆包82.5的平均分。出乎意料的是,地理考试是文综三科中大模型表现最差的,最高分仅仅是 GPT-4o的68分。原因之一可能是地理涉及图片更多,AI识图能力有待提升。
478.43MB
查看550.37MB
查看35.5MB
查看936.11MB
查看274.81MB
查看809.41MB
查看461.18MB
查看705.90MB
查看291.56MB
查看938.36MB
查看130.32MB
查看217.99MB
查看320.44MB
查看317.60MB
查看168.53MB
查看392.58MB
查看550.19MB
查看301.75MB
查看198.52MB
查看138.56MB
查看172.59MB
查看966.49MB
查看235.73MB
查看728.32MB
查看300.50MB
查看402.87MB
查看439.99MB
查看911.79MB
查看966.34MB
查看700.84MB
查看944.16MB
查看725.38MB
查看791.89MB
查看150.30MB
查看345.25MB
查看554.72MB
查看241.24MB
查看421.38MB
查看847.79MB
查看255.63MB
查看186.52MB
查看630.71MB
查看300.81MB
查看469.28MB
查看645.54MB
查看162.19MB
查看790.29MB
查看987.16MB
查看421.33MB
查看402.43MB
查看442.88MB
查看737.96MB
查看185.67MB
查看672.96MB
查看669.57MB
查看869.18MB
查看834.92MB
查看976.22MB
查看799.43MB
查看991.14MB
查看862.42MB
查看501.70MB
查看543.64MB
查看446.23MB
查看259.75MB
查看923.92MB
查看688.46MB
查看984.27MB
查看993.28MB
查看658.95MB
查看811.90MB
查看279.90MB
查看254.15MB
查看307.78MB
查看805.72MB
查看246.17MB
查看352.61MB
查看676.31MB
查看616.14MB
查看391.40MB
查看676.18MB
查看986.82MB
查看412.46MB
查看847.36MB
查看729.97MB
查看240.26MB
查看430.39MB
查看929.28MB
查看648.83MB
查看970.11MB
查看909.75MB
查看854.49MB
查看262.32MB
查看479.77MB
查看616.62MB
查看546.44MB
查看991.31MB
查看270.45MB
查看862.41MB
查看108.85MB
查看616.70MB
查看442.81MB
查看515.39MB
查看846.90MB
查看
789青州fk
花间令审美🎉
2025-06-25 15:26:06 推荐
338188****9164
虞书欣新疆plog🎍
2025-06-25 20:06:18 不推荐
883152****1843
骑手就在小区贴“外卖员及狗不得进入”告示致歉:因工作不顺🎑
2025-06-25 17:27:01 推荐
33足球1对1对决
2025-06-23 16:09:45 推荐