环球速读：五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半-大众职业网

环球速读：五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半

搜狐科技 2023-06-08 23:45:21

一年一度高考季，高考试题是大众关注的焦点，也成为了AI能力的试金石。AI大模型数学功底到底如何？比人类“聪明”吗？搜狐科技使用五款AI大模型对2023高考上海数学试卷进行了同题测试。

在测试中，搜狐科技选取了高考试卷前10道填空题，让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。

测试结果显示，这五款大模型在答数学题的能力上差异显著。

【资料图】

最“聪明”的讯飞星火答对了5题，正确率50％。百度文心一言和ChatGPT“紧跟其后”，答对了4题，正确率为40％。

360智脑和通义千问则“全军覆没”，一道题也没答对，交了白卷。

值得一提的是，昨天搜狐科技也用五款大语言模型产品，对高考作文全国卷（甲）进行了测试，并邀请了5位语文名师打分。

打分结果显示，ChatGPT高考作文得分最高，文心一言、讯飞星火得分稍低，但跟ChatGPT处于同一水平。360智脑和通义千问得分最低。

虽然语文作文题和数学计算题，对大模型能力考察的维度并不尽相同。但巧合的是，不擅长写作文的360智脑和通义千问，似乎也不擅长做数学题。

通过这两次高考题测试，也能从侧面反应出各家大模型的能力确实是“参差不齐”。如果ChatGPT、文心一言、讯飞星火是“学霸”，那么360智脑和通义千问则是妥妥的“学渣”。

附测试中使用的高考数学题题目：

1.不等式|x-2|<1的解集为__

2.a=(2,3)，b=(-1,2)，则a·b=__

3.首项为3，公比为2的等比数列的前六项和S6=__

4.tanA=3，tan2A=__

5.f(x)={2^xx>0;1，x≤0}的值域为__

6.复数z=1-i，则|1+iz|=__

7.圆的方程x^2+y^2-4y-m=0的面积为π，则m=__

8.三角形的三边长为a=4，b=5，c=6，则sinA=__

9.某地一年四个季度的GDP(亿元)，第一季度GDP为232，第四季度GDP为241，且四个季度的GDP逐季度增长，中位数、平均数相等。则该地一年的GDP为__

10.(1+2023x)^100+(2023-x)^100=a0+a1x+a2x^2+…+a100x^100。若ak<0，正数k的最大值为__

责任编辑：

相关资讯

环球速读：五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半

一年一度高考季，高考试题是大众关注的焦点，也成为了AI能力的试金石。

热文：建发（广州）有限公司入选首批广州市重点供应链服务企业

日前，2022年度“广州市重点供应链服务企业”榜单在广州物流供应链行业

世界速看：海尔智家6月8日回购52.00万股耗资1228.58万港币

6月8日海尔智家发布公告称，公司于2023年6月8日在香港交易所回购52 00

当代中国与世界研究院于运全：短视频、网络文学、游戏是国际关注中国的三大话题形态|当前热门

当代中国与世界研究院于运全：短视频、网络文学、游戏是国际关注中国的

吉利星瑞变速箱是什么牌子（星瑞变速箱是什么牌子？）

星瑞(参数|询价)变速箱是MSC5S牌子，星瑞变速箱的最大扭矩是196牛米，

理想全新MPV测试车亮相，车长5米3，或四季度发布-世界热文

如今，各大新势力品牌都在推出MPV车型。这不，一组理想全新MPV车型W01

镇平县遮山镇筑牢安全生产“防护网”

近期，镇平县遮山镇以全国第22个安全生产月为契机，树牢底线思维和风险

世界微资讯！郑州新奇中学招聘简章

一、学校简介郑州新奇中学是郑州市教育局主管的一所全日制民办高级中学

焦点速讯：於可训教授真的在认真写小说，他的中篇小说集《鱼庐记》出版了

极目新闻记者徐颖通讯员冯博近日，由武汉大学文学院资深教授、著名评论

1158万人！今年高校毕业生数量再创历史新高！找工作更难了...

点击下方卡片，关注“CVer”公众号AI CV重磅干货，第一时间送达今天Amu

河南拟开展中医药健康文化素养调查

日前，河南省卫生健康委印发《河南省2023年中国公民中医药健康文化素养

Sensor Tower 公布 5 月中国手游海外收入榜：腾讯第一、米哈游第二-每日简讯

SensorTower公布2023年5月中国手游产品市场收入及下载量排行榜，腾讯《

滚动：俄罗斯创业公司涌入迪拜

俄罗斯创业公司涌入迪拜,今天，迪拜是俄罗斯人最好的地方之一

每日热闻!乌军开始大规模进攻，成功突破顿涅茨克南部防线！

与队长的预判高度一致，进入6月份，乌军的第一个反攻高潮正在到来。乌

重磅！六大国有银行同时宣布新一轮存款利率下调！【附我国银行存款业务分析】|天天快看

图源：摄图网6月8日，工商银行、农业银行、建设银行、中国银行、交通银

最新资讯

环球速读：五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半

2023-06-08

热文：建发（广州）有限公司入选首批广州市重点供应链服务企业

2023-06-08

世界速看：海尔智家6月8日回购52.00万股耗资1228.58万港币

2023-06-08

当代中国与世界研究院于运全：短视频、网络文学、游戏是国际关注中国的三大话题形态|当前热门

2023-06-08

吉利星瑞变速箱是什么牌子（星瑞变速箱是什么牌子？）

2023-06-08

理想全新MPV测试车亮相，车长5米3，或四季度发布-世界热文

2023-06-08

镇平县遮山镇筑牢安全生产“防护网”

2023-06-08

世界微资讯！郑州新奇中学招聘简章

2023-06-08

焦点速讯：於可训教授真的在认真写小说，他的中篇小说集《鱼庐记》出版了

2023-06-08

1158万人！今年高校毕业生数量再创历史新高！找工作更难了...

2023-06-08

河南拟开展中医药健康文化素养调查

2023-06-08

Sensor Tower 公布 5 月中国手游海外收入榜：腾讯第一、米哈游第二-每日简讯

2023-06-08

滚动：俄罗斯创业公司涌入迪拜

2023-06-08

每日热闻!乌军开始大规模进攻，成功突破顿涅茨克南部防线！

2023-06-08

重磅！六大国有银行同时宣布新一轮存款利率下调！【附我国银行存款业务分析】|天天快看

2023-06-08

光纤宽带和普通宽带价格_光纤宽带和普通宽带的区别

2023-06-08

2023年6月18日嘉定101路公交线路调整

2023-06-08

【世界时快讯】2446名考生奔赴考场我县多部门联合护航“高考”这场成人礼

2023-06-08

环球观速讯丨预估开发 6 个月，OpenCore 让旧款 Mac 也可运行 macOS Sonoma

2023-06-08

即时看！天无绝人之路的意思相同的诗句_天无绝人之路的意思

2023-06-08

天天即时看！原神3.8深渊有什么[多图]

2023-06-08

北京文化3涨停_当前信息

2023-06-08

当前观点：长安汽车回应网传供应商“申诉函” 直扣货款等内容不实已报案

2023-06-08

天天速递！（经济）江苏出台14条措施推动外贸稳规模优结构

2023-06-08

长安汽车回应网传供应商“申诉函” 直扣货款等内容不实已报案

2023-06-08

全球快资讯：金蝶标准版固定资产增加结账一直提示未计提折旧_金蝶标准版固定资产怎么增加

2023-06-08

看热讯：足金回收多少钱一克(2023年6月7日）

2023-06-08

速讯：收评：沪指重回3200拉锯！

2023-06-08

意法半导体携手三安光电，推进中国碳化硅生态系统发展

2023-06-08

浙江第四批集采确认纳入重组人生长激素即时看

2023-06-08