(原标题:CXO们,选择大模型,你真的想清楚了吗?)
作为一个在To B服务领域深耕了10多年的老兵,我最近经常接到一些CEO、CIO和各类CXO朋友的咨询。想拥抱大模型,不知道该选谁,看到、听到的大模型名字千奇百怪,中文、英文啥都有,有BAT这类大厂的,也有明星创业公司的,弄的眼花缭乱,又不可能把技术和业务人都堆上去,费时费力的做好几个PoC。让我给一些判断的标准和建议。我这里整理了几条,大家看看有没有道理。
先想清楚你要大模型干嘛。是尝鲜?还是打算长期拥抱?
如果你打算浅尝辄止的玩儿个票。那可以找那几个初创公司,比如百川的7B、智谱的6B开源模型试一下,不怎么花钱,找找感觉。但如果是想真正和业务深度结合,做好了长期数智化升级的准备,那恐怕还是得选百度、阿里这种大厂的品牌货,不为别的,就图个踏实,以后出了问题有人管。
企业选大模型,最核心的考量因素应该是什么?
安全、稳定!相信各位老板自己都很清楚,这两个词怎么强调都不为过。尤其是对于金融业、制造业以及实体行业。再好的产品,再牛的技术,没有安全稳定的保证,还是不敢用。这就像芯片行业,我们国内有的厂商产品已经不弱于、甚至强于海外厂商了,且更便宜,但企业还是不敢轻易的更换,为什么?因为安全性、稳定性还没有验证过,初创公司尤其如此。
大模型听起来新,但其实GPT4前面有1、2、3、3.5。国内,以最早发大模型产品的百度为代表,文心大模型从2019年发布第一版,到现在也持续研发和迭代了4-5年。绝大部份可能暴露的问题都已经出现并解决了,更别说还有搜索、网盘、云等业务,安全和稳定都是最基本的前提,没有十余年的实践打磨与沉淀,是很难保证业务健康发展的。初创公司异军突起,且不论技术是否完全自研,单单就研发周期和试错周期而言,恐怕就无法和大厂相比拟。
技术到底有多重要?怎么精准选择技术最好的做PoC?
大模型是高技术门槛的产品。做出大模型本身不难,但好用,易用,效果好的大模型很难。所以技术水平和模型表现肯定是重中之重。不能都试,怎么办?先找权威机构的报告和全面的测评结果做基础输入。以最头部的厂商为优选,其他厂商除非能证明自己“明显好于”,否则,没有必要冒险尝试
因为大模型发展日新月异,这里推荐两个比较新的权威报告和测评结果。一个是IDC(类似于全球技术领域的评级机构,也是众多500强和国央企集团技术招标时的重要依据)上周发布的《AI大模型技术能力评估报告,2023》。另一个是SuperCLUE这两天刚刚发布的中文大模型排行榜,他们用几千道非公开试题,完全闭卷、相对全面的测试各主流模型。主要结果截图如下:
来源:IDC《AI大模型技术能力评估报告,2023》
综合来看,百度的文心大模型甚至已经超越了GPT3.5,紧逼GPT4,毫无疑问成为首选。智谱和讯飞可以作为备选。但这两家在能否持续投入方面都得打个问号。
除了看技术,还应该看什么?
看配套工具链。大模型虽然有它的通用性,但还不是“即插即用”的,尤其是和各个行业、企业结合,产生有明确的价值前,依然有大量的数据准备、模型训练、模型评估、自动化工程等工作。这一整套的流程都需要足够好用的配套工具做支撑,不然采购回去的大模型用不起来就是竹篮打水一场空。这套工具链的打造基本只有阿里、百度、华为等拥有百亿以上营收云业务的厂商才可能具备。其他公司虽有零星工具。但难以形成好用、配套的体系。
看交付能力。交付是要和客户深度共创,贴身服务,共同完成的。一看经验,二看人员建制。这点是创业公司的极大短板。当创业公司还在摸着石头过河的时候,大厂们早就已经完成了成百上千个不同类型的项目交付工作。拥有着成熟、稳定、配合默契的交付团队。毕竟每个客户白花花的银子投下去,都不希望自己是初创公司用来练手的“小白鼠”。
看行业理解能力。行业理解能力不是简简单单1-2个项目就积攒起来的。它要求厂商不仅仅做过相关的项目,还得是大几百万,甚至是上千万的大项目。否则就是管中窥豹,难见全貌。更重要的是要踩过足够多的“坑”,行业认知都是一点一点被客户骂出来的。相比初创公司,百度、阿里等大厂们踩过的坑、丢过的单子可能都要比他们见过的潜在客户要多。这里强烈建议企业决策者把手上的项目做下分类,把风险小、规模小、重要性低的交给创业公司,而把规模大、难度高、重要性大的交给BAT等大厂来做。
为什么很多初创公司要开源?甚至免费?天下没有免费的午餐
开源对于初创公司的好处是快速获取认知,让更多的人用起来自己的产品,一起来完善,灵活性强。但这是一把双刃剑,因为“集思广益”,恰恰就容易“漏洞百出”。拿着开源模型做测试是没问题的,但是不适合做严谨的商业采购。另外,开源模型的使用对于客户的IT团队开发能力要去是很高的。除了互联网行业和头部金融机构,大部分的传统行业和国央企是没有足够的预算去养一批算法工程师的。与其如此,到不如使用更为安全可靠,易于上手的大厂稳定产品。
天下没有免费的午餐。今天的免费或者低收费是为了未来的高收费或者“忽悠“更多的资金。初创企业免费是为了尽快攒一波看似还不错的客户名字,然后拿给潜在投资人,仿佛获得了众多头部客户的认可,好获得更高的估值和更大金额的投资。可问题是这种方式难以为继,始终是烧钱逻辑,入不敷出。初创大模型公司又没有自己的云底座,而是选择跟多家云厂商合作。云厂商要挣钱,除了支付训练和推理的云消耗费用,初创公司们早晚也需要产生利润满足投资人的诉求。而这部分的价格一定会在后续的服务中溢价向已经绑定的客户收取。这就仿佛日本人当年的打印机策略,机器很便宜,墨盒却很贵,一旦上了贼船,就不好下来了。
相比而言,以百度文心大模型为代表的大厂倒是靠谱的多。作为一家成立超20年,上市超15年的企业,投资人们对公司的考察早就不是“故事“和某几个客户,更多的是真实有效的商业案例和实际的营收与利润。云智一体,软硬一体,给了百度足够的腾挪空间。不仅没有中间商赚差价,还能以最高的性价比压榨出模型的性能。
如何选择长期的合作伙伴?避免留下烂尾工程?
选钱多、人才储备足的。“百模大战”还在进行中,未来可能会像当初的“百团大战”一样只留下少数几个幸存者占据主导地位。大模型的竞争不仅拼资金实力,更拼人才密度。
王慧文雄心勃勃携5000万美元入场,广发英雄帖成立光年之外,不足数月便偃旗息鼓,卖身美团。科大讯飞最新财报利润惨淡,是否能持续投入在大模型研发上,也遭到极大质疑。其他几家创业公司,虽然已经融了数亿资金补血,但在大模型这个“吞金兽”面前是不够挥霍的。几家大厂的有长期稳定的主营业务贡献千亿级别的营收和百亿级别的利润,而且业务护城河较深,有着足够的资金体量可以支持长期的研发,保证模型的不断迭代。
人才方面。一方面,要看模型部署后的运维、保障团队能否跟上。大厂们有着成百上千人经过培训、锤炼过的专职服务人员和完善的保障体系,不会因为某几个人员的变动而影响项目的后期服务。而创业公司往往总共也就几十个人,往往一人身兼多职,又做营销、又做研发、又做保障,短期的“贴身服务“往往在客户增多后就无法长期保持。
“蜜月期”一过,服务质量就大幅下滑,最终只能以烂尾结束。另一方面,要看AI前沿人才和算法工程师的储备厚度,这是确保企业始终走在最前线的核心家底。最优质的人才选择最被看好的企业,而最好的企业才能提供最佳的产品和服务。
在信通院最新的《中国人工智能创新人才竞争力报告中》,百度、腾讯、华为分列前3,并且彼此间还有较大差距。由此来看,无论未来“百模大战“厮杀如何惨烈,百度的文心大模型都有望持续保持领头羊角色。
其实还有很多小的建议,此处就不再展开了。抛砖引玉,希望每一个渴望拥抱大模型的CXO朋友们,都可以想清楚自己到底为什么要拥抱大模型,然后再选择最适合自己的大模型伙伴,共同成长,彼此成就。