(原标题:万兴科技AIGC概念迷雾:60秒文生视频能力遭质疑,开月薪10万招AI人才)
本文来源:时代财经 作者:谢斯临
图源:天幕文生样板视频截图
Sora爆火两月之后,国内迅速有A股上市公司做出跟进,推出同样具备文生视频能力的多媒体大模型。
4月28日,A股数字创意软件龙头万兴科技(300624.SZ)旗下天幕大模型开启公测。据万兴科技此前介绍,该模型是国内首个音视频多媒体大模型,目前已迭代文生音乐、多语言对话、一键成片等近百项音视频原子能力。特别是在文生视频能力上,已实现不同风格、丰富场景及主题的连贯性,一键生成时长支持60秒左右。
这一视频生成时长,甚至可以比肩全球顶级大模型企业OpenAI在今年2月发布文生视频模型“Sora”。该产品最长可生成60秒左右的视频,因其生成视频的一致性、清晰度,和模拟真实物理世界的能力震惊世界。
在公测的同时,万兴科技也公布了2023年业绩,营收与利润均实现明显增长。财报数据显示,公司2023年实现营业收入14.81亿元,同比增长25.49%,归母净利润8620.57万元,同比增长113.20%。
自4月18日宣布将公测天幕大模型之后,其视频生成能力如何尚未可知,但万兴科技的股价和市值却已“闻风而动”。时代财经统计发现,截至4月30日收盘,万兴科技报92元/股,总市值达126.69亿元。相比18日收盘的113.07亿元,其市值上涨超过13亿元,涨幅达12%。
自2018年上市后,万兴科技的股价几经大起大落,作为曾坐拥"独角兽""元宇宙"等多个概念股标签的“妖股”,万兴科技的天幕大模型是否真的如宣传般强大?
在天幕大模型公测后,外界发现,除生成时长这一指标之外,天幕的生成效果与Sora相去甚远。在画面流畅度、连贯性以及拟真能力等多个指标上的表现均不及预期。
万兴科技副总裁朱伟曾公开表示,天幕的模型能力和Sora相比确实还存在一定差距。尤其是文生视频效果方面,他曾在接受媒体采访时表示,“Sora作为行业标杆,是公司正在努力看齐的目标。”
就研发投入、商业化前景等问题,时代财经向万兴科技发去采访提纲。
朱伟在接受时代财经采访时指出,为打造天幕大模型,公司在研发层面配备了上百人的研发团队,每年需投入数千万元,此外还有数据采买的投入和算力的投入,三者总计上亿级别的投入。
此外,朱伟表示,天幕有自己差异化的特点,相较于Sora这类基础模型,天幕更偏向于细分的垂类行业,希望聚焦到每一个具体的应用场景,解决实际问题,为用户带来价值。如AI歌手、数字人播报等能力,就是在具体细分场景中的落地体现,属于纯应用。“我们希望万兴科技的每一款产品,都是技术与应用的结合,能解决某个细分领域的具体问题。”
据时代财经不完全统计,目前已入局AI大模型的国内互联网头部公司中,尚无一家宣传能够生成10秒以上的文生视频,更多的还是图生视频。如腾讯混元曾联合清华、港科大推出图生视频大模型“Follow Your Click”;阿里智能计算研究所也推出过EMO,也仅支持用照片和音频生成唱歌视频。
那么,作为国内第一批宣称拥有60秒AI视频生成的公司,万兴科技到底成色几何?
视频生成效果不及预期?
天幕开放公测后,时代财经第一时间做出试用申请,排在等候序列的1458位,截至发稿申请仍未通过审核。
官网信息显示,天幕主要具备文字生成视频、已有视频风格化处理、文字生成背景音乐、视频配乐、文字生成音效、文字生成图片,以及图片生成图片等7项能力。以市场最受关注的文生视频为例,天幕支持最长2000字的描述词,并提供写实和动漫两种风格进行选择。
图源:万兴科技官网截图
不过,万兴科技提供的两个文生视频示例均只有短短2秒,且视频画面死板单一,只有简单的镜头移动。
而4月18日万兴科技官方公众号放出的59秒样板视频,画面同样僵硬而缓慢。比起Sora放出的一键生成的长视频,这段视频在一致性和连贯性的表现十分初级。
AI算法专家、资深人工智能从业者黄颂在观看样板视频后向时代财经分析指出,该模型生成的视频卡帧明显,而且几乎没有光影效果、物体之间的互动,卡通效果也离真实世界也差得很远。
一位就职于知名清华系AI大模型创业公司的资深人士向时代财经评论道,万兴科技的天幕“更像是缝合怪”,即将多个短视频拼合剪辑为60秒左右的长视频。
事实上,时长是文生视频模型应用落地的关键环节。互联网大厂AI研究员艾长青指出,即便生成视频效果好,但如果没能从底层算法结构上支持视频时长的可扩展性,模型很难找到合适的落地场景,只能停留在实验室环节。
“业界视频生成模型核心关注的点包括视频的生成时长是否是可扩展,以及生成质量是否达标。前者是被认为是根本性、方向性的问题,后者则是数据质量打磨、训练方式的问题。”艾长青表示。
在天幕公测的前一天,4月27日,生数科技首席科学家、清华大学教授朱军在中关村论坛未来人工智能先锋论坛上,发布了视频大模型Vidu。该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT,支持一键生成长达16秒、分辨率高达1080P的高清视频内容。Vidu不仅能够模拟真实物理世界,还拥有丰富想象力,具备多镜头生成、时空一致性高等特点。
生数科技的投资人启明创投发文评价道:“Vidu是自Sora发布之后全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平,并在加速迭代提升中。”
德邦证券研报亦指出,在以镜头语言为代表的动态性,以及对物理世界规律的理解与模拟能力等方面已做到了Sora相近水平,Vidu或将发挥在国产视频大模型的“鲇鱼效应”,激励国产多模态大模型突破创新。
可见,万兴科技天幕大模型的能力表现与之相比仍有一定差距。
但也有声音认为,国产视频生成模型仍处于初级阶段,早期效果不佳可以理解。艾长青向时代财经指出,视频是三维以上的空间,相比于文本模型,训练难度数量级增加,必须依靠大量算力作为支撑。当前,国内没有足够的算力,较难开展视频生成模型的研究。
“国内视频生成模型距离应用程度还有很长的路要走,至少还需要两年甚至更长时间,才会有通用效果比较好的模型出现。”艾长青因此认为,国内陆续有视频生成模型问世其实是件好事,只有迈出第一步,才能够相互交流不断迭代提升能力。
时代财经还发现,万兴科技近期在以极高的待遇吸引AI领域的高端人才。据万兴科技此前发布的2024年度春招信息,AIGC相关产品经理和研发岗位的基础起薪超过40万,其中图形图像算法工程师等关键岗位月薪最高可达10万元,年薪超过百万元;多模态音视频算法工程师、基础平台架构师等岗位月薪亦超过5万元。
图源:万兴科技官网
天使投资人、资深人工智能专家郭涛则向时代财经指出,对于文生视频模型这一新兴领域,不同公司产品可能处在不同发展阶段,“即便万兴科技的天幕大模型在各方面表现都不如Sora,但这并不代表他们的技术研发没有价值,最终还是要看与实际业务、市场应用的结合情况。”
AIGC间接带动业绩增长
通用大模型的竞争是少数平台级巨头公司的游戏,对于绝大多数企业来说,更关键的是如何将已有的能力投入可以快速变现的商业场景——天幕大模型究竟能给万兴科技带来多少业务增量?
作为一家以向C端客户销售创意类数字软件的上市公司,万兴科技从2023年开始,就已经尝试将AIGC能力应用在产品之中,不仅旗下万兴喵影、万兴PDF、亿图图示、亿图脑图、万兴易修等多款产品上线了适配的AIGC功能,如AI抠图、AI降噪、AI文案、AI图片生成等,还发布了数字人短视频营销工具万兴播爆、AI虚拟陪伴应用TruMate、AI文字视频剪辑工具Kwicut等创新型的AIGC产品。
但这些探索没有直接转化成为收入。朱伟向时代财经透露,公司大多数原有产品暂未强制推行AI收费等商业化策略,因此并未带来直接的收入增长。
影响更多是间接的。朱伟以万兴喵影举例表示,该产品自去年10月底上线文本成片、AI音乐生成等功能后,一定程度带动内容服务需求和用户粘性的提升,年内实现素材资源订阅金额提升100%,进一步优化产品的营收质量和效率。
万兴科技在2023年年报中表示,AIGC能力的引入,叠加产品迭代升级的影响,帮助公司文档创意类产品线付费用户数提升20%,营收达1.3亿元,同比增长30.92%;绘图创意类产品月活同比增长30%,营收达1.29亿元,同比增长30.52%;视频创意类产品订阅续费率提升5%个点,营收达9.6亿元,同比增长28.91%。
然而随着文生文、文生图等AIGC技术应用的不断深入,带来的产品创新空间逐渐被挖掘殆尽,万兴科技增长开始放缓。2024年一季度,万兴科技录得营业收入3.58亿元,同比增长0.9%;归母净利润2564.98万元,同比增长22.99%。
目前还未得到大规模落地应用的视频生成模型能力,成为万兴科技下一步增长的关键。只是考虑到现阶段还不成熟的视频生成效果,和仍旧高昂的训练、推理成本,其商业化变现路径仍不明确。
“在文本大模型领域,免费可能是大家的共识,因为成本相对可控,而且用户越多越有利于大模型快速升级。但对于训练成本、推理成本巨大的视频大模型来说,必须考虑更多。”朱伟指出,从原则上来讲,万兴科技会更慎重地向免费用户提供视频AIGC能力。同时,重点将这一能力推向付费意愿和能力相对更强的B端用户,尽快把音视频多媒体大模型真正推向商用。
据万兴科技年报,其前五大客户占其年度销售总额比例为66.96%。
去年曾被两次问询是否炒作AI
尽管大模型能力差强人意,但并不妨碍上市公司从市值方面“获利”。以万兴科技为例,自去年以来,就不断有声音质疑其蹭AI概念热点炒作股价。
去年大模型爆火带动AI概念股股价起飞之时,万兴科技就曾多次在互动平台释放与ChatGPT相关利好,如表示公司已有商用账号开通GPT-4的API接口;已与微软签订了云服务框架协议,且海外主要产品已接入Azure OpenAI服务等。
一番操作后,万兴科技也成了当年涨幅最大的几只牛股之一。雪球数据显示,2023年,万兴科技股价从年初的每股30.65元,一路疯涨,到同年6月20日的顶峰时刻,曾一度触及每股172.2元的历史记录,涨幅超过4倍。而后股价开始回落,截至2023年底仍报每股94.6元,涨幅超过208%。
图源:Pixabay
2023年3月27日和5月8日,万兴科技两次收到深交所的关注函,询问公司相关产品运用ChatGPT、AIGC等技术的具体情况,有无带来直接收入,以及是否存在蹭热点、炒概念及配合股东减持的情形。
万兴科技对此回复表示,公司采用AIGC相关技术旨在实现功能升级和智能化效率提升,增强产品吸引力。但未针对AI新技术、新功能进行单独收费,因此没有带来直接收入;也暂未收到实控人、董监高的减持计划,因此不存在蹭热点、炒概念及配合股东减持的情形,后续有相关事项,公司将严格按照规定做出披露。
然而就在2023年5月回复完深交所不到半个月之后,万兴科技便发布公告表示,公司实控人吴太兵计划在未来6个月时间内,减持不超过206万股,即不超过公司总股本的1.5%。同年7月26日,这一减持计划宣告结束,以减持均价初略计算,吴太兵套现超过2亿元。
实控人在股价高点减持套现无疑是巨大利空,这无疑让万兴科技的AIGC蒙上了一层迷雾,如今万兴科技虽然发布了拥有文生视频能力的大模型,但显然仍未消除资本市场的疑虑。
在吴太兵去年减持万兴科技前后,还有大量AI牛股上演花样减持,如创始人前妻减持并将50%收益借给上市公司的昆仑万维(300418.SZ),以及被质疑离婚式减持的三六零(601360.SH)等。
在中国数实融合50人论坛智库专家洪勇看来,判断一家公司行为是否涉嫌蹭概念炒作,需从实际研发投入、产品功能、市场应用等多个角度综合考虑。
“如果万兴科技只是在宣传上夸大其词,而没有实质性技术创新或明显产品优势,可能确实存在概念炒作的嫌疑。但如果其持续在技术研发上有所投入,并且产品能够逐步提升并满足特定市场需求,即便当前表现不如国际先进水平,也应视为行业发展的正常过程。”洪勇对时代财经表示。