(原标题:通义千问2.5版本发布,超越GPT-4-Turbo或成全球最强中文大模型)
阿里云在通义大模型发布一周年之际,于5月9日正式发布了通义千问2.5版本。据官方宣称,该版本在中文语境下模型性能全面赶超GPT-4-Turbo,根据权威基准Open Compass的测评结果,通义千问2.5得分追平GPT-4-Turbo,是该基准首次录得国产大模型取得如此出色的成绩。与此同时,通义千问1100亿参数开源模型Qwen1.5-110B在GPQA等权威基准测评中取得极佳成绩,超越Meta的Llama-3-70B;在Hugging Face的开源大模型排行榜上位列第一。
多模态与专有能力领先业界
除了在基础语言模型上的突破,通义大模型在多模态和专有领域的能力也得到显著提升。通义多模态模型通过对视觉、语音等多模态信息的理解和生成,实现了更自然、高效的人机交互。在专有领域,通义推出了一系列面向医疗、教育、游戏等行业的定制化模型,帮助企业快速构建AI应用。这些多模态和专有能力模型已成功应用于PC、手机、汽车、航空、天文、矿业等多个行业,展现出通义大模型业界顶尖的技术影响力。
大模型开闭源之争
通义千问1100亿参数开源模型在多个基准测评中脱颖而出,充分展现了其技术实力。开发者的反馈和开源社区的生态支持是通义大模型技术进步的重要助力。自2022年8月宣布加入开源行列以来,通义已推出多款开源模型,累计下载量超过700万次。这一系列举措不仅降低了AI开发者和中小企业的训练和迭代成本,也加速了大模型的应用落地进程。未来,通义大模型还将持续开源,为AI行业的发展贡献力量。
阿里云首席技术官周靖人表示,开源开发者生态对技术发展的贡献毋庸置疑,模型之上的应用和创新非常多,不能仅仅局限于使用某一款闭源的框架或者说只能对接某一个形式。阿里云的数据显示,其通义大模型已经通过阿里云服务超过9万家企业。通义大模型在PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等多个领域实现了落地应用。这些成绩的取得,离不开开源生态的支持和贡献。
与此同时,也有业内人士表示,闭源模型在能力上会持续领先,闭源有真正的商业模式,能够赚钱并聚集算力和人才。闭源模式下,企业可以更好地控制模型的迭代方向和速度,确保模型能力与商业需求的匹配度,提高商业变现的效率。同时,闭源模式也有利于保护企业的核心技术和数据资产,防止被竞争对手模仿和超越。
本文源自:金融界
作者:巨灵