(原标题:我们不是“钢铁侠”,但每个人都需要一个“贾维斯”)
文:互联网江湖 作者:刘志刚
小时候,希望能像托尼·史塔克一样有战甲,也希望自己也能拥有一个AI伙伴“贾维斯”。长大后才发现,现实版的“贾维斯”可能是个搜索引擎?
5月14日,谷歌在I/O开发者大会上推出最新多模态AI产品,一石激起千层浪,AI搜索这个赛道又热闹起来。望观中国大模型市场,前有B端大佬彻底打响价格战,后有C端巨头宣布日活跃用户突破100万大关,前仆后继的AI应用,正在掀起一场科技革命。
谷歌I/O发布会上提到,谷歌的大模型可以提供一个三天的膳食计划:
这个demo中所体现的能力,我们能明显发现,来自中国的天工AI搜索很早就已经上线了。最新消息显示,昆仑万维旗下的天工AI用户活跃度已经突破100万,成为国内AIGC应用的“王炸”产品,这表明天工AI受到了用户们的狂热追捧。
这是天工AI根据我的日程给出的一份图文并茂的行程规划,与谷歌的图文呈现能力如出一辙:
当然,如果你希望生成像gemini一样的图表形式也完全OK,并且支持任何产品深度对比分析。
最近高考就要来了,强烈建议大家用这个功能进行报志愿选择,可以清晰对比出每个院系的优劣。
面对日常信息需求,天工AI也完美解决了时效性问题,不仅可以轻松地查询天气情况,股票、油价、彩票、金价、快递、日落时间、星座运势、解梦等很多实时性信息都非常完善,而且视觉体验感很不错,高度符合用户搜索习惯,离传统搜索引擎被淘汰又近了一步。
用过天工AI之后,有一个强烈的感觉:多模态很强的大模型搜索,不像是搜索引擎,反而更像是一个搜索产品形态的“AI全能助手”,是一个嵌在PC和手机里的“贾维斯”。
要知道,AI+搜索做得好并不容易,谷歌之外,国外做得好的有Perplexity、notion、newbing,国内字节百度一线大厂也都在做。有意思的是,国内AI搜索的“鼻祖”既不是字节也不是百度。
把这个问题抛给百度文心一言以及 Perplexity,就有了答案:“天工AI搜索”。
2019年,昆仑万维开始在全球布局AIGC业务,2023年4月天工skywork首款国内自研大模型上线,同期的大模型还有文心一言、通义千问、讯飞星火。2023年8月,天工推出中国第一款AI搜索产品——天工AI搜索,自此掀起了国内AI搜索浪潮。
天工AI有多强?国内AI 搜索“鼻祖”究竟有多少含金量?
不试不知道,一试发现根本停不下来…… 亲身体验过后隐约觉得,就像当年谷歌搜索改变整个互联网,如今AI时代大门打开,一场新的无形的技术革命正在发生。
AI生产力时代,AI大模型是每一个人的“贾维斯”
技术革命是无形的,但产品是有形的。
能不能创造一个时代,得看产品好不好用,能不能解决生产力的问题。用过一段时间之后,我发现天工AI是有可能解决这个问题的。
原因在于,天工AI有了解决复杂case的能力。
这是天工AI搜索的网页入口:www.tiangong.cn
在手机端App“天工”,即可下载安装使用,小程序端搜索「天工AI智能助手」可直接使用。
打开网页版天工AI搜索,会出现这样一个界面:
从产品的角度看,这不像是一个“搜索”UI,而像一个“系统”UI。
这似乎表明,天工AI搜索的易用性很强,左边是多模态的能力,搜索框上也有三种模式可选,满足不同程度的信息深度获取。
不过,传统的大模型的一个痛点在于一次只能解决一个问题,缺乏应对复杂需求的能力,原因就在于缺乏多模态能力。比如,对于内容创作来说,多模态能力不够,则意味着不能完成更多的复杂工作,很难真正地提升效率。
天工AI大模型作为MoE混合专家大模型,很好地解决了这个问题。
文本解析、大纲创作、脚本生成、图片生成以及音乐生成,天工的搜索3.0+AI速读+AI写作+AI音乐大模型,几乎深入到了图文、视频内容创作链条的各个环节。而面对复杂的case,调用如此之多的能力,前后花费的时间其实不超过10分钟。
这个效率是十分惊人的。
接下来,我们不妨通过一些实操,来看看天工AI的多模态能力到底能解决哪些问题。
1、AI生成PPT:解放“办公室生产力”
作为媒体,有时候也会制定一些传播方案。
假如某汽车品牌搭载最新版本智驾的产品上市在即,需要制作一个传播方案,这个时候,天工大模型就能帮你解决很多问题,而你所需要做的其实只有三步:
第一步,先用天工AI生成一个大纲;
第二步,可以直接在页面上直接进一步修改,或者直接按照大纲使用AI生成PPT;
第三步,确定好大纲后直接生成PPT,然后简单修改调整,一份传播方案就完成了。整个过程的时间,也就几分钟,效率非常高。
实际上,多模态能力之间的配合,结果不是简单1+1,而1+1×n的能力倍增。这也是为什么天工AI能够充分解放“办公室生产力”的关键。
2、自然语言模型+音乐大模型:视频创作者的“马良神笔”。
短视频时代,人们获取信息越来越碎片化,短视频kill Time的特性,使得人们的注意力大部分都在短视频平台上。
所以,如今媒体人的工作,除了写文章之外,很大一部分精力都花在视频上。
做视频这个事儿,跟写文章很不一样。文案之外,要求有更多的制作能力,而制作的过程中,很大一部分精力其实是花在找素材上,效率其实很低。
这个时候,如果用上天工AI转绘+自然语言模型+音乐大模型,则可解决大部分的效率问题,甚至带来意想不到的创造力。
天工AI的视频转绘功能,可以轻松从视频帧中提取特征,转化为漫画或者其他风格的视觉艺术效果。
这是一段女孩儿跳舞的视频,可以转化为动漫人物风格:
这是电影《泰坦尼克号》中的“名场面”,转化为迪士尼风格后的画面:
强大的AI转绘能力,就好像赋予了创作者一支“马良的神笔”,可以把自己日常的拍摄的视频轻松转化为动漫作品和影视动画作品。
如果你觉得风格化的创作太艺术化了,作为媒体人还是想做一个专业类的视频,天工AI也很容易就给出一个可用的文案,甚至,它很懂得把特斯拉FSD拉过来做背景板……
用AI大模型辅助视频类创作,经常会遇到的一个问题是,能解决文本的需要,一些大模型也能做到视频生成。但问题是做视频就少不了用音乐,版权问题怎么办?
天工AI很好地解决了这个问题。在天工AI的多模态能力中,嵌入了中国首个音乐SOTA模型:天工音乐大模型。
使用起来也很简单,只要想好了歌名与歌词,再找一段参考的音频,就算不懂乐理的小白也能有创作音乐的能力。
如果你不会写歌词,也想不到好的歌名,也不用着急,只要找一首歌曲作为风格参考,天工AI会自动“脑补”所有的内容,帮你实现创作。
经过几分钟之后,天工音乐大模型就成功地制作出三个版本的原创歌曲,在试听后,可以把创作的音乐投稿到平台,分享给其他的网友。另外也可以下载下来,用作视频的BGM,整个流程很快,音乐作品本身的完成度也很高。
下面就是用天工AI生产成的音乐。
坚定信念的未来-2,互联网江湖,2分钟
其实不仅仅是媒体,天工音乐大模带来的这种全新创作方式,也将会对整个音乐行业产生颠覆性的影响。
天工SkyMusic作为国内首个音乐SOTA大模型,在人声、BGM音质、人声自然度、发音可懂度等几个关键维度上领先海外顶尖音乐大模型Suno V3。有天工音乐大模型,每一个普通人都有机会成为“作曲家、唱作人”,音乐创造真正走向大众。
在音乐这个领域,天工大模型正在引领一个新的“GPT时刻”。
3、AI+搜索:从写作到深度创作
对于复杂的媒体内容策划和写作,传统的文本大模型能够实现长文本分析,但这其实只是第一步,接下来,还需要一个完整的稿件大纲。
这份大纲其实并不简单,内容是否准确,其实很考验语言模型能力和搜索引擎能力的融合能力。天工AI给出的这份大纲很准确,接下来,我们可以让天工AI对这份答案进行一个扩写,然后就得到了一份1800字的完整版的稿件大纲。
这份大纲包含了华为与赛力斯的合作分析、智驾行业趋势发展、技术发展、市场接受度以及法律法规、行业竞争多方面出发,最终得出“智驾是汽车行业下半场关键”“技术创新与用户体验的双重驱动”“合作与竞争推动行业健康发展”等核心观点。
难的是,天工AI好像真的理解什么是智能驾驶、什么是汽车产业,而不是一些简单的信息摘取。这里面体现的就是MoE混合专家大模型的能力。
有意思的是,在给出大纲后,天工AI 大模型还给出了很多关联的提问,比如华为与赛力斯的合作有哪些内容?智能驾驶发展对行业的深远影响等。
大纲完善后,接下来,只要用天工对各个部分进行详细扩写,一篇关于智驾的行业分析深度文章就已经基本成型了。
4、AI图片生成:包容无限想法的超级素材库
做内容,少不了要用图片素材。
内容完成之后,还能用AI图片生成直接做一张文章头图,这样创作者就再也不担心图片侵权的问题了。
除此之外,AI图片生成最有价值的,是能把一个好的想法变成可用的画面素材,这对创作的效率提升是巨大的。
实际上,天工的AI图片生成能力本身就是一个庞大的素材库,而好的想法就是一个检索词,通过AI图片生成去找到最适合的素材,从而使内容创造更简单,更直接。
图片素材之外,天工AI还能直接生成漫画,把漫画创作者的想法直接变成作品,从而帮助漫画作者,减少冗杂的工作量,释放更多的创造力。
5、多模态能力:人人都需要的“贾维斯”
从实际的体验来看,我是有点被震撼到的,天工AI多模态能力,正在成为创作者的“贾维斯”。
从行业深度文案创作,到素材生成,再到新车型上市的传播方案制定,以及视频脚本生成、内容素材、背景音乐制作。这么长的一个工作流,天工AI都可以做到全程参与。并且,项目报告评估、行业白皮书等,这些对专业和行业背景要求更高的工作,AI也能很好胜任。
在我用过的大模型产品中,目前除了天工AI之外,没有任何一款AI工具集这么多模型能力于一身。
以搜索为主,天工AI的多模态能力带来结果就是,复杂case的执行变得效率更高了也更容易了。实际上,用户实际的场景需求很复杂,AI要真的成为“贾维斯”,就得懂得更多,并且能做得更多。
由此来看,开发天工AI的技术实力很强,而且对产品的理解能力很强。产品力越强,意味着用户可以真正用它提高生产力。
互联网江湖一直以来都认为,AI大模型能不能引发新一轮趋势,除了看技术先进不先进,另外就是好不好用,能不能解决实际的问题。
谁在定义产品上做得更好,谁就代表着真正的AI生产力。
而多模态能力满足复杂case执行、大模型时效性能力的背后,隐现的是一线国际大厂的技术能力储备以及定义产品的能力。
这些能力之下,一场新的搜索产品革命或许就此展开。
大模型“巧夺天工”:AI搜索革命,它来了
每个时代都有自己的技术烙印,21世纪的前十年是PC互联网,10年代到20年是移动互联网,20年代到现在则是AI互联网。
从2000年到现在,每一波技术浪潮下,都诞生了不同的巨头。PC时代,是百度、360;移动时代是腾讯、字节;AI时代会是谁?目前还没有确切的答案。
有一点可以笃定,下一个巨头必然是有原生创新能力的AI玩家,是在AI领域积累够深,且底层创新能力足够强大的玩家。
目前,市面上的AI+搜索有四种。
第一种:自研大模型+自研搜索引擎;
第二种:自研大模型+非自研搜索引擎;
第三种:非自研大模型+自研搜索引擎;
第四种:一些小厂的非自研大模型+非自研搜索引擎。
而昆仑万维正是自研大模型+自研搜索引擎的深度玩家,真正能引发行业革命的,务必是真正有实力的高精专团队。
一来,大模型是个极其耗费资源的业务,大厂有稳定的收入来源,能够做更长期主义的投入;二来,大厂有很强的研发资源和产品能力,做大模型更容易成功。
大厂里面,百度、字节等都是上个时代的玩家,能不能做好AI这个新产品,能不能开创下个AI时代很难说。
百度的优势在于搜索引擎份额很稳,字节的优势在于有源源不断的流量池。
总之,各有各的王牌。
百度、字节之外,天工是中国AI搜索鼻祖,也是探索行业的先驱者,昆仑万维也有丰富的自研经验和强大的自研能力,在AI和搜索引擎行业都有很深的积累。
产品方面,昆仑万维很多年前已经在海外做出的opera浏览器,也取得了巨大成功,做AI搜索,是有基因优势的。
人才方面,昆仑万维大模型研发中心高级算法工程师多达300人+,其中海内外名校博士100+,大量人才来自微软、阿里、百度,也有一线大厂的研发实力。
有国际经验的一线大厂,研发实力强大,可用的资源丰富。
这意味着几件事儿:
首先,迭代的速度很快,意味着核心的AI能力能够迅速适应市场竞争的变化。
AI为什么能这么强,强就强在版本迭代速度快,能不断“进化”。这个过程中,“喂”给AI的数据、算力越多,进化的能力就越强。
百度字节、天工是自研模型+自研搜索,有大量的人才、技术储备,能满足AI进化的需求,也能敏锐洞察市场变化。
AI拼到最后,拼的是参数量,拼的是算力,只有大厂才“喂”得起数据,也才能训练出更强的AI。
其次,AI行业是一个赢者通吃的行业,AI革命先行者总能吃到更多红利。
现实点来讲,大模型+ 搜索应用之后,全球搜索市场的格局在变化。
在产品上,对比全球同类的产品,天工AI在多模态能力、中文搜索能力以及中文用户习惯上并不差。
所以,海外的中文搜索市场,昆仑万维也是有机会分一杯羹的。
目光回到国内市场,AI革命也会搅动搜索市场的份额,而天工AI作为行业引领者,也自然有更多的机会。
在互联网商业链路中,搜索商业之所以能够开启一个时代,很重要的一个点在于能够挖掘需求,并嵌入商品和服务(百度搜索)。搜索之后,后来嵌入商品和服务是图文(微信公众号、小程序),现在是直播和短视频(抖音)。
那么,未来会不会是天工AI?会不会是昆仑万维?现在看来还没有确切答案。
不过,AI+搜索一个很重要的价值是,平台发现用户需求会更容易。发现需求的下一步就是满足需求,所以,在大模型中嵌商品与服务的可能性,才是这波AI革命最重要的意义之一。这也是百度、字节以及昆仑万维等大厂的想象力所在。
大厂的成功,也是中国AI的成功,天工AI表现出的产品力,也为整个中国的AI竞争力打了一针强心剂。
过去几年,大模型的出现,让人们对AI有了更多的期待。AI行业是个赢者通吃的行业,但AI也是一个永远有创新红利的行业。天工AI的成功似乎也证明了这一点。
AI+搜索,开启的是一个全新的生产力时代。这是一场巨变。
身处这场巨变中,作为一名中国人也感到特别淡然,因为我们知道,新时代的征程伊始,我们已经走在了最前面。