首页 - 财经 - 产业观察 - 正文

文心一言通义千问们互评高考作文,快打起来了!

来源:AI蓝媒汇 2024-06-07 19:06:49
关注证券之星官方微博:

(原标题:文心一言通义千问们互评高考作文,快打起来了!)


作者|蓝媒汇编辑部


又是一年高考时,随着第一科语文考试结束,全国高考作文题目再度成为全网热议。


一年前的今天,大模型风口渐起,除了照例有各路大V、达人在朋友圈、微博等社交平台展开作文大赛之外,ChatGPT、文心一言、讯飞星火三款头部大模型也被AI蓝媒汇(id:lanmeih001)“请来”作答高考作文。


而在2024年,百花齐放的国产大模型已在性能和体验上不输GPT-4,使用更多中文语料的训练也让这些本土玩家普遍“更懂中文”。


于是,AI蓝媒汇以新课标I卷作文题为例,分别测评了BAT三家传统大厂,以及科大讯飞、月之暗面、百川智能三位热门选手的共计六款主流大模型,还引入了大模型互评环节。


谁考得最好,谁没发挥好,拭目以待。




· 新课标I卷 作文题目:


阅读下面的材料,根据要求写作。(60分)随着互联网的普及、人工智能的应用,越来越多的问题能很快得到答案。那么,我们的问题是否会越来越少?以上材料引发了你怎样的联想和思考?请写一篇文章。要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于800字。




· 百度 文心一言4.0:


其余五款大模型打分如下:


综合得分:55.8




· 阿里云 通义千问2.5:


其余五款大模型打分如下:


综合得分:56.8


附:文心一言给出满分的原因




· 腾讯 元宝:


其余五款大模型打分如下:


综合得分:58.2


附:文心一言给出满分的原因




· 科大讯飞 讯飞星火:


其余五款大模型打分如下:


综合得分:57.2




· 月之暗面 Kimi:


其余五款大模型打分如下:


综合得分:55.2


附:讯飞星火给出低分的原因




· 百川智能 百小应:


其余五款大模型打分如下:


综合得分:56




从测试以及评分结果来看,在所有六款大模型之中,文心一言综合打分最高,给友商文章平均打出了58的高分。其中还有两次给了满分。


而讯飞星火打分最低,给友商文章平均只给出了53.2的分数。


那么,这些作文,你给多少分?


来源|AI蓝媒汇

fund

微信
扫描二维码
关注
证券之星微信
APP下载
相关股票:
好投资评级:
好价格评级:
证券之星估值分析提示科大讯飞盈利能力一般,未来营收成长性一般。综合基本面各维度看,股价偏高。 更多>>
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。如该文标记为算法生成,算法公示请见 网信算备310104345710301240019号。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-