我们不是“钢铁侠”，但每个人都需要一个“贾维斯”_财经频道

（原标题：我们不是“钢铁侠”，但每个人都需要一个“贾维斯”）

文：互联网江湖作者：刘志刚

小时候，希望能像托尼·史塔克一样有战甲，也希望自己也能拥有一个AI伙伴“贾维斯”。长大后才发现，现实版的“贾维斯”可能是个搜索引擎？

5月14日，谷歌在I/O开发者大会上推出最新多模态AI产品，一石激起千层浪，AI搜索这个赛道又热闹起来。望观中国大模型市场，前有B端大佬彻底打响价格战，后有C端巨头宣布日活跃用户突破100万大关，前仆后继的AI应用，正在掀起一场科技革命。

谷歌I/O发布会上提到，谷歌的大模型可以提供一个三天的膳食计划：

这个demo中所体现的能力，我们能明显发现，来自中国的天工AI搜索很早就已经上线了。最新消息显示，昆仑万维旗下的天工AI用户活跃度已经突破100万，成为国内AIGC应用的“王炸”产品，这表明天工AI受到了用户们的狂热追捧。

这是天工AI根据我的日程给出的一份图文并茂的行程规划，与谷歌的图文呈现能力如出一辙：

当然，如果你希望生成像gemini一样的图表形式也完全OK，并且支持任何产品深度对比分析。

最近高考就要来了，强烈建议大家用这个功能进行报志愿选择，可以清晰对比出每个院系的优劣。

面对日常信息需求，天工AI也完美解决了时效性问题，不仅可以轻松地查询天气情况，股票、油价、彩票、金价、快递、日落时间、星座运势、解梦等很多实时性信息都非常完善，而且视觉体验感很不错，高度符合用户搜索习惯，离传统搜索引擎被淘汰又近了一步。

用过天工AI之后，有一个强烈的感觉：多模态很强的大模型搜索，不像是搜索引擎，反而更像是一个搜索产品形态的“AI全能助手”，是一个嵌在PC和手机里的“贾维斯”。

要知道，AI+搜索做得好并不容易，谷歌之外，国外做得好的有Perplexity、notion、newbing，国内字节百度一线大厂也都在做。有意思的是，国内AI搜索的“鼻祖”既不是字节也不是百度。

把这个问题抛给百度文心一言以及 Perplexity，就有了答案：“天工AI搜索”。

2019年，昆仑万维开始在全球布局AIGC业务，2023年4月天工skywork首款国内自研大模型上线，同期的大模型还有文心一言、通义千问、讯飞星火。2023年8月，天工推出中国第一款AI搜索产品——天工AI搜索，自此掀起了国内AI搜索浪潮。

天工AI有多强？国内AI 搜索“鼻祖”究竟有多少含金量？

不试不知道，一试发现根本停不下来…… 亲身体验过后隐约觉得，就像当年谷歌搜索改变整个互联网，如今AI时代大门打开，一场新的无形的技术革命正在发生。

AI生产力时代，AI大模型是每一个人的“贾维斯”

技术革命是无形的，但产品是有形的。

能不能创造一个时代，得看产品好不好用，能不能解决生产力的问题。用过一段时间之后，我发现天工AI是有可能解决这个问题的。

原因在于，天工AI有了解决复杂case的能力。

这是天工AI搜索的网页入口：www.tiangong.cn

在手机端App“天工”，即可下载安装使用，小程序端搜索「天工AI智能助手」可直接使用。

打开网页版天工AI搜索，会出现这样一个界面：

从产品的角度看，这不像是一个“搜索”UI，而像一个“系统”UI。

这似乎表明，天工AI搜索的易用性很强，左边是多模态的能力，搜索框上也有三种模式可选，满足不同程度的信息深度获取。

不过，传统的大模型的一个痛点在于一次只能解决一个问题，缺乏应对复杂需求的能力，原因就在于缺乏多模态能力。比如，对于内容创作来说，多模态能力不够，则意味着不能完成更多的复杂工作，很难真正地提升效率。

天工AI大模型作为MoE混合专家大模型，很好地解决了这个问题。

文本解析、大纲创作、脚本生成、图片生成以及音乐生成，天工的搜索3.0+AI速读+AI写作+AI音乐大模型，几乎深入到了图文、视频内容创作链条的各个环节。而面对复杂的case，调用如此之多的能力，前后花费的时间其实不超过10分钟。

这个效率是十分惊人的。

接下来，我们不妨通过一些实操，来看看天工AI的多模态能力到底能解决哪些问题。

1、AI生成PPT：解放“办公室生产力”

作为媒体，有时候也会制定一些传播方案。

假如某汽车品牌搭载最新版本智驾的产品上市在即，需要制作一个传播方案，这个时候，天工大模型就能帮你解决很多问题，而你所需要做的其实只有三步：

第一步，先用天工AI生成一个大纲；

第二步，可以直接在页面上直接进一步修改，或者直接按照大纲使用AI生成PPT；

第三步，确定好大纲后直接生成PPT，然后简单修改调整，一份传播方案就完成了。整个过程的时间，也就几分钟，效率非常高。

实际上，多模态能力之间的配合，结果不是简单1+1，而1+1×n的能力倍增。这也是为什么天工AI能够充分解放“办公室生产力”的关键。

2、自然语言模型+音乐大模型：视频创作者的“马良神笔”。

短视频时代，人们获取信息越来越碎片化，短视频kill Time的特性，使得人们的注意力大部分都在短视频平台上。

所以，如今媒体人的工作，除了写文章之外，很大一部分精力都花在视频上。

做视频这个事儿，跟写文章很不一样。文案之外，要求有更多的制作能力，而制作的过程中，很大一部分精力其实是花在找素材上，效率其实很低。

这个时候，如果用上天工AI转绘+自然语言模型+音乐大模型，则可解决大部分的效率问题，甚至带来意想不到的创造力。

天工AI的视频转绘功能，可以轻松从视频帧中提取特征，转化为漫画或者其他风格的视觉艺术效果。

这是一段女孩儿跳舞的视频，可以转化为动漫人物风格：

这是电影《泰坦尼克号》中的“名场面”，转化为迪士尼风格后的画面：

强大的AI转绘能力，就好像赋予了创作者一支“马良的神笔”，可以把自己日常的拍摄的视频轻松转化为动漫作品和影视动画作品。

如果你觉得风格化的创作太艺术化了，作为媒体人还是想做一个专业类的视频，天工AI也很容易就给出一个可用的文案，甚至，它很懂得把特斯拉FSD拉过来做背景板……

用AI大模型辅助视频类创作，经常会遇到的一个问题是，能解决文本的需要，一些大模型也能做到视频生成。但问题是做视频就少不了用音乐，版权问题怎么办？

天工AI很好地解决了这个问题。在天工AI的多模态能力中，嵌入了中国首个音乐SOTA模型：天工音乐大模型。

使用起来也很简单，只要想好了歌名与歌词，再找一段参考的音频，就算不懂乐理的小白也能有创作音乐的能力。

如果你不会写歌词，也想不到好的歌名，也不用着急，只要找一首歌曲作为风格参考，天工AI会自动“脑补”所有的内容，帮你实现创作。

经过几分钟之后，天工音乐大模型就成功地制作出三个版本的原创歌曲，在试听后，可以把创作的音乐投稿到平台，分享给其他的网友。另外也可以下载下来，用作视频的BGM，整个流程很快，音乐作品本身的完成度也很高。

下面就是用天工AI生产成的音乐。

坚定信念的未来-2,互联网江湖,2分钟

其实不仅仅是媒体，天工音乐大模带来的这种全新创作方式，也将会对整个音乐行业产生颠覆性的影响。

天工SkyMusic作为国内首个音乐SOTA大模型，在人声、BGM音质、人声自然度、发音可懂度等几个关键维度上领先海外顶尖音乐大模型Suno V3。有天工音乐大模型，每一个普通人都有机会成为“作曲家、唱作人”，音乐创造真正走向大众。

在音乐这个领域，天工大模型正在引领一个新的“GPT时刻”。

3、AI+搜索：从写作到深度创作

对于复杂的媒体内容策划和写作，传统的文本大模型能够实现长文本分析，但这其实只是第一步，接下来，还需要一个完整的稿件大纲。

这份大纲其实并不简单，内容是否准确，其实很考验语言模型能力和搜索引擎能力的融合能力。天工AI给出的这份大纲很准确，接下来，我们可以让天工AI对这份答案进行一个扩写，然后就得到了一份1800字的完整版的稿件大纲。

这份大纲包含了华为与赛力斯的合作分析、智驾行业趋势发展、技术发展、市场接受度以及法律法规、行业竞争多方面出发，最终得出“智驾是汽车行业下半场关键”“技术创新与用户体验的双重驱动”“合作与竞争推动行业健康发展”等核心观点。

难的是，天工AI好像真的理解什么是智能驾驶、什么是汽车产业，而不是一些简单的信息摘取。这里面体现的就是MoE混合专家大模型的能力。

有意思的是，在给出大纲后，天工AI 大模型还给出了很多关联的提问，比如华为与赛力斯的合作有哪些内容？智能驾驶发展对行业的深远影响等。

大纲完善后，接下来，只要用天工对各个部分进行详细扩写，一篇关于智驾的行业分析深度文章就已经基本成型了。

4、AI图片生成：包容无限想法的超级素材库

做内容，少不了要用图片素材。

内容完成之后，还能用AI图片生成直接做一张文章头图，这样创作者就再也不担心图片侵权的问题了。

除此之外，AI图片生成最有价值的，是能把一个好的想法变成可用的画面素材，这对创作的效率提升是巨大的。

实际上，天工的AI图片生成能力本身就是一个庞大的素材库，而好的想法就是一个检索词，通过AI图片生成去找到最适合的素材，从而使内容创造更简单，更直接。

图片素材之外，天工AI还能直接生成漫画，把漫画创作者的想法直接变成作品，从而帮助漫画作者，减少冗杂的工作量，释放更多的创造力。

5、多模态能力：人人都需要的“贾维斯”

从实际的体验来看，我是有点被震撼到的，天工AI多模态能力，正在成为创作者的“贾维斯”。

从行业深度文案创作，到素材生成，再到新车型上市的传播方案制定，以及视频脚本生成、内容素材、背景音乐制作。这么长的一个工作流，天工AI都可以做到全程参与。并且，项目报告评估、行业白皮书等，这些对专业和行业背景要求更高的工作，AI也能很好胜任。

在我用过的大模型产品中，目前除了天工AI之外，没有任何一款AI工具集这么多模型能力于一身。

以搜索为主，天工AI的多模态能力带来结果就是，复杂case的执行变得效率更高了也更容易了。实际上，用户实际的场景需求很复杂，AI要真的成为“贾维斯”，就得懂得更多，并且能做得更多。

由此来看，开发天工AI的技术实力很强，而且对产品的理解能力很强。产品力越强，意味着用户可以真正用它提高生产力。

互联网江湖一直以来都认为，AI大模型能不能引发新一轮趋势，除了看技术先进不先进，另外就是好不好用，能不能解决实际的问题。

谁在定义产品上做得更好，谁就代表着真正的AI生产力。

而多模态能力满足复杂case执行、大模型时效性能力的背后，隐现的是一线国际大厂的技术能力储备以及定义产品的能力。

这些能力之下，一场新的搜索产品革命或许就此展开。

大模型“巧夺天工”：AI搜索革命，它来了

每个时代都有自己的技术烙印，21世纪的前十年是PC互联网，10年代到20年是移动互联网，20年代到现在则是AI互联网。

从2000年到现在，每一波技术浪潮下，都诞生了不同的巨头。PC时代，是百度、360；移动时代是腾讯、字节；AI时代会是谁？目前还没有确切的答案。

有一点可以笃定，下一个巨头必然是有原生创新能力的AI玩家，是在AI领域积累够深，且底层创新能力足够强大的玩家。

目前，市面上的AI+搜索有四种。

第一种：自研大模型+自研搜索引擎；

第二种：自研大模型+非自研搜索引擎；

第三种：非自研大模型+自研搜索引擎；

第四种：一些小厂的非自研大模型+非自研搜索引擎。

而昆仑万维正是自研大模型+自研搜索引擎的深度玩家，真正能引发行业革命的，务必是真正有实力的高精专团队。

一来，大模型是个极其耗费资源的业务，大厂有稳定的收入来源，能够做更长期主义的投入；二来，大厂有很强的研发资源和产品能力，做大模型更容易成功。

大厂里面，百度、字节等都是上个时代的玩家，能不能做好AI这个新产品，能不能开创下个AI时代很难说。

百度的优势在于搜索引擎份额很稳，字节的优势在于有源源不断的流量池。

总之，各有各的王牌。

百度、字节之外，天工是中国AI搜索鼻祖，也是探索行业的先驱者，昆仑万维也有丰富的自研经验和强大的自研能力，在AI和搜索引擎行业都有很深的积累。

产品方面，昆仑万维很多年前已经在海外做出的opera浏览器，也取得了巨大成功，做AI搜索，是有基因优势的。

人才方面，昆仑万维大模型研发中心高级算法工程师多达300人+，其中海内外名校博士100+，大量人才来自微软、阿里、百度，也有一线大厂的研发实力。

有国际经验的一线大厂，研发实力强大，可用的资源丰富。

这意味着几件事儿：

首先，迭代的速度很快，意味着核心的AI能力能够迅速适应市场竞争的变化。

AI为什么能这么强，强就强在版本迭代速度快，能不断“进化”。这个过程中，“喂”给AI的数据、算力越多，进化的能力就越强。

百度字节、天工是自研模型+自研搜索，有大量的人才、技术储备，能满足AI进化的需求，也能敏锐洞察市场变化。

AI拼到最后，拼的是参数量，拼的是算力，只有大厂才“喂”得起数据，也才能训练出更强的AI。

其次，AI行业是一个赢者通吃的行业，AI革命先行者总能吃到更多红利。

现实点来讲，大模型+ 搜索应用之后，全球搜索市场的格局在变化。

在产品上，对比全球同类的产品，天工AI在多模态能力、中文搜索能力以及中文用户习惯上并不差。

所以，海外的中文搜索市场，昆仑万维也是有机会分一杯羹的。

目光回到国内市场，AI革命也会搅动搜索市场的份额，而天工AI作为行业引领者，也自然有更多的机会。

在互联网商业链路中，搜索商业之所以能够开启一个时代，很重要的一个点在于能够挖掘需求，并嵌入商品和服务（百度搜索）。搜索之后，后来嵌入商品和服务是图文（微信公众号、小程序），现在是直播和短视频（抖音）。

那么，未来会不会是天工AI？会不会是昆仑万维？现在看来还没有确切答案。

不过，AI+搜索一个很重要的价值是，平台发现用户需求会更容易。发现需求的下一步就是满足需求，所以，在大模型中嵌商品与服务的可能性，才是这波AI革命最重要的意义之一。这也是百度、字节以及昆仑万维等大厂的想象力所在。

大厂的成功，也是中国AI的成功，天工AI表现出的产品力，也为整个中国的AI竞争力打了一针强心剂。

过去几年，大模型的出现，让人们对AI有了更多的期待。AI行业是个赢者通吃的行业，但AI也是一个永远有创新红利的行业。天工AI的成功似乎也证明了这一点。

AI+搜索，开启的是一个全新的生产力时代。这是一场巨变。

身处这场巨变中，作为一名中国人也感到特别淡然，因为我们知道，新时代的征程伊始，我们已经走在了最前面。

证券之星微信

扫描二维码

关注

证券之星微信