首页 - 财经 - 国内经济 - 正文

谷歌发布新一代大模型Gemini 2.0,备战智能体时代

来源:经济观察报 2024-12-12 22:51:13
关注证券之星官方微博:

(原标题:谷歌发布新一代大模型Gemini 2.0,备战智能体时代)

12月12日,谷歌推出大模型Gemini 2.0 ,谷歌CEO桑达尔·皮查伊(Sundar Pichai)称,这是谷歌为新智能体时代构建的下一代模型,也是谷歌迄今为止最强的大模型。

Gemini 2.0 Flash是谷歌此次发布的Gemini 2.0系列模型中的第一个模型。相比上一代模型Gemini 1.5 Flash,Gemini 2.0 Flash除了支持图片、视频和音频等多模态输入,还支持多模态输出,例如其可以直接生成图像与文本混合的内容,以及原生生成可控的多语言文本转语音(TTS)音频。Gemini 2.0 Flash还可以原生调用谷歌搜索、代码执行以及第三方用户定义的函数等工具。

皮查伊表示,如果说Gemini 1.0的作用是整合和理解信息,那么Gemini 2.0能够做到让信息更加有用。

基于Gemini 2.0模型,谷歌能够构建新的AI智能体,从而离构建通用助手的愿景更进一步。智能体(Agent)是指能够感知环境并采取行动以实现特定目标的代理体,也被视为大模型落地的“最后一公里”。

过去一年里,谷歌持续开发了更多智能体模型。在发布Gemini 2.0的同时,谷歌也介绍了多个智能体。例如,Project Astra是通过多模态理解现实世界的智能体,它可以在多种语言和混合语言之间进行对话,能够理解不同口音和生僻单词,并以接近人类对话的延迟来理解语言。Project Astra最多可以记住长达10分钟的会话内容,并且可以回忆起过去与它进行的多轮对话,以便为用户提供更好的个性化服务。Project Astra还能使用谷歌搜索、谷歌地图等工具。 Project Astra被应用于谷歌的AI助手Gemini app以及智能眼镜等其他设备及产品中。

除此之外,谷歌还开发了可以帮助用户完成复杂任务的智能体、面向开发者的智能体,以及面向游戏和其他领域的智能体。

在Gemini 2.0发布当天,新加坡科研局资深科研工程师黄佳就体验了该模型,并将其与OpenAI最新发布的o1模型进行对比。他的测试方式是提供一系列参考文档,给出复杂逻辑,让大模型进行自主编程,并提供详细文案解释。

黄佳表示,在一般情况下,ChatGPT o1的逻辑推理还是更强。具体而言,两个模型都体现出了很强的分析推理能力,但ChatGPT o1可以接受的文档输入长度较长,Gemini 2.0会截断部分太长的参考文档;此外,ChatGPT o1给出的代码,质量较高,缺陷(bug)较少,ChatGPT o1的代码解释更详尽,更接近黄佳想要的写作风格,Gemini 2.0的解释文案较为简略。

黄佳感觉到,虽然目前大模型仍不可能仅靠简单的提示词,就自主干活,满足需求,还需要在人的驱动之下,在精准的业务场景中,经过设计、编程、整合等过程,才能够成为智能体,但是大模型能力在进步,人们对大模型能力边界的认识也越来越清晰,这带来了智能体发展的加速,周围同事也在更多地用智能体做实际项目。

微信
扫描二维码
关注
证券之星微信
APP下载
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-