(原标题:清华系大模型蛰伏五周年:1位先锋串起半部创业史,3个校友争“一哥”)
本文来源:时代财经 作者:徐晓倩
图源:pixabay
仅仅过了一年,大模型竞争就出现了分野。
近期,有媒体报道称,由王小川创立的百川智能进行新一轮数亿美元融资,将成为国内2024年最大AI领域融资之一。来自参与的投资人证实,百川智能今年以来估值已超18亿美元(约130亿元)。对此,百川智能方面回应时代财经表示,报道存在一定误差,具体信息有待官方进一步宣布。
如果上述融资消息落地,这意味着又一家清华系大模型公司跻身百亿估值俱乐部。
据时代财经不完全统计,2019年-2023年至少有30位清华校友下场创业,投入大模型产业,创办公司超过15家,累计融资超过150亿元。这些由清华校友创办的企业,在业内被称为“清华系”。
随着清华系大模型企业估值走高,一场行业内的“三国杀”默默上演。
大模型绕不开清华系
三年前,两位初代互联网创业大佬先后宣告退圈。
2020年12月,美团发布内部信宣布,美团联合创始人、高级副总裁王慧文已经顺利完成交棒,按计划正式退出。半年后,搜狗被腾讯收购,曾经在搜索领域叱咤风云的王小川也逐渐远离互联网舞台中央。
此时的大洋彼岸,AI学术界正升起一颗耀眼的新星。OpenAI推出的GPT-3横空出世,在学术界掀起不小波澜,其参数规模高达 1750 亿,不仅能做语言生成,而且对语言的理解能力也有了很大的提升。
对外界而言,GPT还远没有爆发出潜在的能量。但是一群清华大学的顶尖学者迅速做了一个重大的决定:追赶GPT3、投入大模型训练中。
三年后,GPT-4通过一款对话产品将大模型的风吹到全球各地。王慧文率先发起了AI大模型人才的招募令,紧接着,王小川、李开复等互联网明星创业者纷纷登场。王慧文、王小川这对昔日的清华校友,因为大模型再次交汇于竞技场上。只是这一次,他们离开舒适区后,还要面临着更多来自“学术圈”的对手。
在百模大战的核心风暴中,清华系毫无疑问地成为举足轻重的一方势力,他们如同一条奔腾的江河逐渐分流成各具特色的溪流,有的是在互联网时代身经百战的老法师,有的已经在大模型研究领域中蛰伏多年。
“如果你做大模型或者芯片,那你最好是清华的。”一位芯片行业从业者向时代财经表示。诸多科研人才、创业公司与技术储备,共同构建起一张叫做“清华系”的人脉之网,这似乎已经成为某种行业共识。
过去一年里,大模型独角兽企业技术人员每天熬夜,为了追赶OpenAI前仆后继。
光年之外和智谱AI都把根据点选在了清华东门外的搜狐大厦;隔着一条街是赛尔大厦,王小川在此创立了百川智能;搜狐大厦南侧的成府路上也有两家清华系创业公司,分别是聆心智能和深言科技。
一场新的造富运动正轰轰烈烈开展,“清华系”成为绕不开的历史钢印。
1位先锋串起半部创业史
多年后,当外界追忆起这段烈火烹油的大模型创业潮时,智源研究所无疑会成为一个标志性的符号。这里距离清华大学南门步行只要5分钟,如今,清华主校区三公里以内都是大模型创业的根据地。
2020年,人工智能普遍陷入了进退两难的困局,AI四小龙市值跌落谷底,巨额的研发投入和低效的落地产出,使得一批投资人纷纷撤退。西南证券的一份研报显示,AI企业融资次数从2019年开始,出现了大幅下滑,九成AI公司处于亏损状态。
与外界浓重的悲观情绪相反,智源研究所正在默默酝酿着一场变革,该研究所齐聚了孙茂松、唐杰、刘知远、杨植麟等一众大模型先锋人物,他们一致认为大模型训练能够带来一场颠覆性的变革。
数百人将自己的热情和精力投入大模型的炼丹炉中,开启了一段漫长的开荒期,。
2021年初,命名为悟道1.0的大模型登场,该系列大模型呈现了 3000 万图文数据对训练的多模态模型 BriVL 1.0、百亿参数中英双语大模型 GLM-10B 与多模态模型 CogView 1.0 等成果。
在此基础上,身为带队老师的唐杰做了一个更大胆的尝试,他调用外部资源,训练了几个百万亿级别的大模型。3个月后,悟道2.0系列大模型亮相。作为对标GPT-3的国产大模型系统,悟道2.0以1.75万亿的参数量,创造了当时全球最高纪录,超出了GPT-3近10倍,这也成为中国大模型初创阶段标志性的里程碑。
唐杰的另一个身份是智谱AI的创始人之一,公司成立于2019年6月,清华大学计算机系知识工程实验室是其摇篮,团队核心成员几乎都是清华血脉。
悟道系列大模型一战成名后,清华系创业的氛围被推向了一个小高潮。一批清华校友逐渐从实验室走出来,探究大模型商业化的路径。
2021 年 11 月,黄民烈创立了聆心智能;2022 年 3 月,孙茂松的博士生岂凡超创立了深言科技;2022 年 8 月,刘知远创立了面壁智能,专注于法律领域;2023年,同样师从孙茂松的朱军建立了生数科技。
此时,大模型创业团队再次面临一个困局:找不到大模型与市场的连接点,愿意吃螃蟹的企业并不多,甚至不知道怎样调度大模型的能力。
直到一个核爆点的出现,这批早期的开荒者才抢到了通向下一个技术变革的入场券。
学院派VS创业派
2022年11月,OpenAI推出的ChatGPT横空出世,自动生成文字的功能震撼了全球科技圈,用户规模在短短2个月内突破1亿,大模型开始进入大众视野。
如同一夜春风袭来,默默耕耘数载的清华系大模型收获了资本的青睐,最先抢占了风口。时代财经整理发现,2023年,清华系大模型的融资逐渐迎来了快车道,超过一半的清华系大模型第一笔上亿级别的融资发生在2023年。
“过去几年,AI投资基本为0,在大家觉得满眼雾霾的时候,突然ChatGPT出来了,给人带来了光。”澜舟科技创始人周明发出了这样的感叹。
这是一场深不见底的资源投入,训练一款高质量的大模型,需要数以万计的芯片集群和云计算调度,并且还要夜以继日的追赶被OpenAI叠高的行业指标,一旦开启,就意味着启动了庞大的碎钞机。
据国盛证券研报,GPT-3仅训练一次的成本就高达140万美元,对于一些更大的LLM,一次训练成本介于200万美元至1200万美元之间。智谱AI CEO张鹏也曾在公开场合表示,25亿元的融资根本不够,不管融多少、挣多少钱,都是通向AGI这条路上的盘缠。
2023年10月,智谱AI宣布完成超25亿元融资(估值过百亿元);也在同一时期,百川智能迎来了新一轮的融资,金额超过3亿美元;月之暗面则在去年接连完成了两轮共计近20亿元的融资。
相比学院派艰难低调的蛰伏,互联网明星创业者通常更加果断坚决,他们对应用产品和市场有更为敏锐的判断力。2023年年初,在见证ChatGPT的问世后,身为互联网连续创业者的王小川嗅到了技术变革的气息,他激动地发了一条朋友圈:“OpenAI的胜利,是技术理想主义的胜利。”
先成立公司、再招募技术团队的路径,是创业者快速抢占市场目光的最佳方式。思考了两周后,王小川便放下了手头的智慧健康项目,转而进攻大模型。
不到半年,百川智能的团队便搭建起来了,王小川拿到5000万美元启动资金,正式宣布进入AI模型创业赛道。 此外,他还拉来了旧部下——前搜狗COO、清华1998级校友茹立云,新的创业公司有一半成员来自原搜狗团队。
经历了长达半年的横冲直撞,独角兽大模型名单逐渐浮出水面——智谱AI、月之暗面、百川智能、MiniMax和零一万物,其2023年公开披露的融资约为100亿元,占全国AI投资的40%,清华系大模型再次赢得了半壁江山。
然而,从整体的融资规模来看,大模型概念的火爆并没有引发投资热潮。根据晚点报道,2023年AI领域的总融资额同比减少4.5%,为257亿元,不到2021年的一半。
“这个市场目前处在募资难、投资难、退出难的形势下,所以对于大模型,大多数机构还都是看为主,真正出手的话,也不像以前我们经常说的 FOMO(fear of miss out),是出于‘担心错过’的情绪。”梅花创投创始合伙人吴世春此前接受时代财经采访时表示。
谁是清华系大模型一哥?
如果没有智能助手Kimi的爆火,月之暗面可能不会快速站在聚光灯下。过去一年,创始人杨植麟几乎隐匿于同门师兄声势浩大的追逐中,获得的曝光度并不多。
2024年开年,文生视频应用Sora、长文本概念走红,短暂熄火的大模型投资得以再次回温。月之暗面最先被资本抬高身价,传出完成新一轮超10亿美元的融资,这是ChatGPT出现后大模型赛道最大一笔融资,估值达到25亿美元(约180亿元),投资方包括阿里、红杉中国、小红书、美团等。
1992年出生的杨植麟成为整个大模型领域的焦点人物,入局大模型之前,杨植麟已经构思了两个问题,一是创业筹备的第一笔资本,二是构建创业的方向——通过与人类互动找到应用机会。
2023年10月,月之暗面推出了智能助手Kimi,成为大模型创业公司的首个爆款项目,3月19日,月之暗面宣布把长文本能力从20万字提升至200万字,其当周访问量达到了394万次,略高于文心一言的338万次,一度跃升为国内网页端周度访问量最高的AI应用。
在部分行业人士看来,月之暗面弯道超车的武器在于绑定了长文本的标签,并且定位比较垂直。“面向C端的产品更容易赢得市场关注,但同时也会因为缺乏技术壁垒容易被超越。”AI创业者张维向时代财经说道,他认为,大模型的发展方向依然比较模糊,大家都在摸着石头过河,面对的是一个完全未知的世界。
作为大模型行业的布道者,唐杰创立的智谱AI频繁对外投资,出现在13家大模型公司的融资队伍中,包括了算力、软硬件、应用、医药、保险等多个方向。
不过,当技术像烟花一样盛放光芒时,身在局中的人很难分清楚这是虚晃的幻术还是可以碰触的真实世界。
“以为得到一把万能的锤子,看见什么都觉得是钉子,但其实发现,业务场景很难切入。面向B端去做企业资源不够,选择做C端推广和成本都是问题。”张维向时代财经说道。
即便是生态较为成熟的百度,也尚未在大模型领域找到光明的出口。根据公开披露的数据,2023年最后一个季度,大模型为百度云业务仅带来6.6亿元的增量收入。
“掌握模型核心技术的团队会在竞争中脱颖而出,推出相应的应用产品,进行多次的迭代和优化,找到合适的路线。如果只单纯开发应用产品,没有自己掌握的核心技术,基本上只有一次试错机会。”启明创投合伙人周志峰近日在公开场合表示,在他看来,具备大模型技术水平的公司终将会走向模型应用一体化的公司。
如果把视线放在清华系竞技场的核心地带,“三国杀”也开始步入正题。
智谱AI、月之暗面和百川智能快速跻身100亿美元估值俱乐部,只是三者使用的武器并不相同:拥有学院派背景的智谱AI,在寻找企业与大模型的融合场景;月之暗面创始人杨植麟是极致的技术理想主义,他相信技术“暴力美学”能够改变世界;而在两种路线踌躇的王小川更想在理想主义和现实主义中找到另一种视角。
和大多数从业者一样,混沌与彷徨几乎贯穿了张维创业的一整年,不知道接下来行业走向何方的他,还在等待一个坐标系的出现。