(原标题:与华为组战队突破算力钳制,科大讯飞董事长刘庆峰:明年上半年对标GPT-4)
本文来源:时代财经 作者:谢斯临
科大讯飞董事长刘庆峰,图片来源:科大讯飞
科大讯飞董事长刘庆峰兑现了他5个月前的承诺,星火大模型3.0版在10月24日如期而至。
综合多方测试来看,升级过后的星火大模型,已经能够全面对标ChatGPT(3.5版)。分语言来看,星火大模型3.0中文能力已经超越 ChatGPT(3.5版),英文能力也能与之相当。
这已经是星火大模型迎来的第3次升级。相比8月发布的2.0版,3.0版在数学自动提炼规律、小样本学习、代码项目级理解、多模态指令跟随与细节表达等能力上取得进一步提升,星火大模型因此可以实现个性化AI人设、启发探究式对话,以及一键生成文献综述报告等一系列新的功能。
在第六届世界声博会暨2023全球1024开发者节接近两个小时的发言里,50岁的刘庆峰始终保持着极高的热情,他不停挥舞手臂,声嘶力竭的向台下的观众介绍科大讯飞大模型的最新进展。以至于发布会结束后,刘庆峰的声音已经开始有些沙哑。
然而,在会场之外,出现意外插曲。科大讯飞旗下学习机被曝出现不当内容,引发股价闪崩。10月24日,科大讯飞收报每股46.7元,跌幅接近10%。
在会后的群访过程中,刘庆峰对此做出详细回应。其指出,该事件发生在一周前,公司在发现问题后,内部已第一时间下架内容,对合作伙伴已进行了处罚。同时,科大讯飞已经把大模型的内容审核机制放到学习机上,以做更严的审核。
刘庆峰不禁感慨,中国创新不易。“越是打压越激发我们的斗志,同时让我们看到确实还要更加严格地把内容保障好,把阳光健康的教育领域做得更实。”
突破算力封锁,明年上半年对标GPT-4
发布会上,最让刘庆峰感到激动的是科大讯飞自主创新的算力底座“飞星一号”。在介绍这一与华为联手、基于昇腾生态的大模型算力平台时,刘庆峰声音明显更为铿锵有力。
据刘庆峰介绍,2023年初,科大讯飞与华为昇腾启动专项攻关,与华为联合研发高性能算子库,合力打造中国通用AI新底座。而刚刚发布的星火大模型3.0版,正是国内首个真正在国产算力平台上训练出来,能够对标ChatGPT的大模型产品。
“唯有自主可控,才有生生不息的大未来。”刘庆峰表示,这不仅是中国企业的抱团取暖,也是在为世界提供第二种选择。
数天之前,美国商务部工业和安全局更新2022年发布的对华半导体出口管制规定,将此前对“处理性能”和“互连带宽”的限制,升级为对“性能密度”的限制,即新规只看GPU的算力总和。
根据这一新规,不仅A100、H100等先进AI芯片无法售往中国,就连英伟达为绕过禁令推出的性能减配版芯片A800、H800对华销售也将受到限制,仍在起步阶段的国产多模态大模型产业不可避免将受到一定冲击。
在此情况下,自主产品的研发势在必行。“飞星一号”的出现,或许能为正在迷茫之中的国产大模型行业打个样。
不过,科大讯飞方面并未对外披露这一算力底座的具体参数。刘庆峰强调,经过科大讯飞和华为“联合特战队”持续半年的不断努力,已经成功将星火大模型训练和推理效率翻番。
其也坦言,任何算力平台都会经历一个从不好用到好用的过程,早期一定会花费更多的训练时间,这是不可避免的,但这是中国发展自主可控大模型的必经之路。“生态的繁荣要一个过程,如果谁都不往前走一步,那这个国家始终没有办法自立自强。”
而随着“飞星一号”的发布,刘庆峰透露,科大讯飞将正式启动对标GPT-4更大参数规模大模型的训练,预计将在2024年上半年内成功实现这一目标。
在他看来,国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上距GPT-4都还有一定差距。
“将认知大模型赋能千行百业是一场硬仗,绝不是靠吹牛能做成的,我们必须正视今天和GPT-4的差距,找到差距所在。只有实事求是的科学精神才能真正实现超越。”刘庆峰表示。
大模型赋能行业,首先要赋能代码
此次发布会上得到强调的另一重点,是星火大模型3.0的代码能力。
在刘庆峰看来,市场已经形成共识,在产业数字化和数字产业化的过程中,都离不开代码能力的支持。无论是哪个企业,是使用还是参与开发,都已经离不开软件。从这一角度理解,大模型赋能行业,首先要赋能代码。
代码能力因此成为大模型产品能力迭代的重要方向。科大讯飞采用多家公开测试集测试后发现,星火大模型在Python、Java、JS、C++等编程语言,以及代码补全、代码解释、测试检错、编程问答等方面,已经成功超越ChatGPT,但略逊于GPT-4。
科大讯飞已经将这一领先的代码能力集成为智能编程助手iFlyCode,并跟随底层模型能力的提升不断升级。刘庆峰透露,这一编程助手从7月开始就已经在科大讯飞内部推广开来,历经多个项目、多轮试验发现,iFlyCode可以帮助编程的设计阶段提效50%、开发阶段提效37%、测试阶段提效44%,总体提效超过20%,大幅提升软件从业人员效率。
除大模型底座的能力升级以外,科大讯飞还面向金融、汽车、运营商、工业、住建、物业、法律、科研文献、传媒、政务、文旅、水利等12个领域发布了垂直行业大模型。
在国内大模型战场上,一众玩家早已达成共识,距离应用场景更近、面向B端市场的垂直行业大模型才是目前真正能够产生商业化的刚需领域。百度、腾讯、华为等一众大厂均已高调入局。
但问题在于,不同行业、企业的需求各不相同,将显著提升大模型厂商的定制化成本,最终可能导致商业价值难以实现闭环。类似的困境已经在云服务厂商身上上演。曾被视为互联网大厂增长第二极的云服务在历经多年竞争之后,陷入服务同质化的困境,只能依靠大打价格战抢夺市场,集体陷入低毛利的螺旋陷阱。
具备更强通用属性的代码能力,或将成为科大讯飞突围的关键。在回应时代财经提问时,刘庆峰指出,iFlyCode将成为科大讯飞大模型商业化非常重要的一个切入点。
在他看来,科大讯飞必须仔细分析场景,证明应用的效果并将其工具化,如将定制工具、企业知识库学习和行业知识学习场景定制化,使企业内部能够快速使用。因此,我们需要大幅降低定制成本,同时在典型场景上做得更好,以使在需要定制的各个领域的比例越来越低。
“它肯定是一个通用能力,龙头企业、单个企业用好以后把场景再全面推广,这需要一个过程。”