与华为组战队突破算力钳制，科大讯飞董事长刘庆峰：明年上半年对标GPT-4_财经频道

（原标题：与华为组战队突破算力钳制，科大讯飞董事长刘庆峰：明年上半年对标GPT-4）

本文来源：时代财经作者：谢斯临

科大讯飞董事长刘庆峰，图片来源：科大讯飞

科大讯飞董事长刘庆峰兑现了他5个月前的承诺，星火大模型3.0版在10月24日如期而至。

综合多方测试来看，升级过后的星火大模型，已经能够全面对标ChatGPT（3.5版）。分语言来看，星火大模型3.0中文能力已经超越 ChatGPT（3.5版），英文能力也能与之相当。

这已经是星火大模型迎来的第3次升级。相比8月发布的2.0版，3.0版在数学自动提炼规律、小样本学习、代码项目级理解、多模态指令跟随与细节表达等能力上取得进一步提升，星火大模型因此可以实现个性化AI人设、启发探究式对话，以及一键生成文献综述报告等一系列新的功能。

在第六届世界声博会暨2023全球1024开发者节接近两个小时的发言里，50岁的刘庆峰始终保持着极高的热情，他不停挥舞手臂，声嘶力竭的向台下的观众介绍科大讯飞大模型的最新进展。以至于发布会结束后，刘庆峰的声音已经开始有些沙哑。

然而，在会场之外，出现意外插曲。科大讯飞旗下学习机被曝出现不当内容，引发股价闪崩。10月24日，科大讯飞收报每股46.7元，跌幅接近10%。

在会后的群访过程中，刘庆峰对此做出详细回应。其指出，该事件发生在一周前，公司在发现问题后，内部已第一时间下架内容，对合作伙伴已进行了处罚。同时，科大讯飞已经把大模型的内容审核机制放到学习机上，以做更严的审核。

刘庆峰不禁感慨，中国创新不易。“越是打压越激发我们的斗志，同时让我们看到确实还要更加严格地把内容保障好，把阳光健康的教育领域做得更实。”

突破算力封锁，明年上半年对标GPT-4

发布会上，最让刘庆峰感到激动的是科大讯飞自主创新的算力底座“飞星一号”。在介绍这一与华为联手、基于昇腾生态的大模型算力平台时，刘庆峰声音明显更为铿锵有力。

据刘庆峰介绍，2023年初，科大讯飞与华为昇腾启动专项攻关，与华为联合研发高性能算子库，合力打造中国通用AI新底座。而刚刚发布的星火大模型3.0版，正是国内首个真正在国产算力平台上训练出来，能够对标ChatGPT的大模型产品。

“唯有自主可控，才有生生不息的大未来。”刘庆峰表示，这不仅是中国企业的抱团取暖，也是在为世界提供第二种选择。

数天之前，美国商务部工业和安全局更新2022年发布的对华半导体出口管制规定，将此前对“处理性能”和“互连带宽”的限制，升级为对“性能密度”的限制，即新规只看GPU的算力总和。

根据这一新规，不仅A100、H100等先进AI芯片无法售往中国，就连英伟达为绕过禁令推出的性能减配版芯片A800、H800对华销售也将受到限制，仍在起步阶段的国产多模态大模型产业不可避免将受到一定冲击。

在此情况下，自主产品的研发势在必行。“飞星一号”的出现，或许能为正在迷茫之中的国产大模型行业打个样。

不过，科大讯飞方面并未对外披露这一算力底座的具体参数。刘庆峰强调，经过科大讯飞和华为“联合特战队”持续半年的不断努力，已经成功将星火大模型训练和推理效率翻番。

其也坦言，任何算力平台都会经历一个从不好用到好用的过程，早期一定会花费更多的训练时间，这是不可避免的，但这是中国发展自主可控大模型的必经之路。“生态的繁荣要一个过程，如果谁都不往前走一步，那这个国家始终没有办法自立自强。”

而随着“飞星一号”的发布，刘庆峰透露，科大讯飞将正式启动对标GPT-4更大参数规模大模型的训练，预计将在2024年上半年内成功实现这一目标。

在他看来，国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上距GPT-4都还有一定差距。

“将认知大模型赋能千行百业是一场硬仗，绝不是靠吹牛能做成的，我们必须正视今天和GPT-4的差距，找到差距所在。只有实事求是的科学精神才能真正实现超越。”刘庆峰表示。

大模型赋能行业，首先要赋能代码

此次发布会上得到强调的另一重点，是星火大模型3.0的代码能力。

在刘庆峰看来，市场已经形成共识，在产业数字化和数字产业化的过程中，都离不开代码能力的支持。无论是哪个企业，是使用还是参与开发，都已经离不开软件。从这一角度理解，大模型赋能行业，首先要赋能代码。

代码能力因此成为大模型产品能力迭代的重要方向。科大讯飞采用多家公开测试集测试后发现，星火大模型在Python、Java、JS、C++等编程语言，以及代码补全、代码解释、测试检错、编程问答等方面，已经成功超越ChatGPT，但略逊于GPT-4。

科大讯飞已经将这一领先的代码能力集成为智能编程助手iFlyCode，并跟随底层模型能力的提升不断升级。刘庆峰透露，这一编程助手从7月开始就已经在科大讯飞内部推广开来，历经多个项目、多轮试验发现，iFlyCode可以帮助编程的设计阶段提效50%、开发阶段提效37%、测试阶段提效44%，总体提效超过20%，大幅提升软件从业人员效率。

除大模型底座的能力升级以外，科大讯飞还面向金融、汽车、运营商、工业、住建、物业、法律、科研文献、传媒、政务、文旅、水利等12个领域发布了垂直行业大模型。

在国内大模型战场上，一众玩家早已达成共识，距离应用场景更近、面向B端市场的垂直行业大模型才是目前真正能够产生商业化的刚需领域。百度、腾讯、华为等一众大厂均已高调入局。

但问题在于，不同行业、企业的需求各不相同，将显著提升大模型厂商的定制化成本，最终可能导致商业价值难以实现闭环。类似的困境已经在云服务厂商身上上演。曾被视为互联网大厂增长第二极的云服务在历经多年竞争之后，陷入服务同质化的困境，只能依靠大打价格战抢夺市场，集体陷入低毛利的螺旋陷阱。

具备更强通用属性的代码能力，或将成为科大讯飞突围的关键。在回应时代财经提问时，刘庆峰指出，iFlyCode将成为科大讯飞大模型商业化非常重要的一个切入点。

在他看来，科大讯飞必须仔细分析场景，证明应用的效果并将其工具化，如将定制工具、企业知识库学习和行业知识学习场景定制化，使企业内部能够快速使用。因此，我们需要大幅降低定制成本，同时在典型场景上做得更好，以使在需要定制的各个领域的比例越来越低。

“它肯定是一个通用能力，龙头企业、单个企业用好以后把场景再全面推广，这需要一个过程。”

证券之星微信

扫描二维码

关注

证券之星微信