首页 - 财经 - 全球市场 - 正文

对标亚马逊、OpenAI,谷歌(GOOGL.US)连发AI利器:多模态模型Gemini Embedding 2正式上线

(原标题:对标亚马逊、OpenAI,谷歌(GOOGL.US)连发AI利器:多模态模型Gemini Embedding 2正式上线)

智通财经APP获悉,谷歌(GOOGL.US)周二发布其首个多模态人工智能(AI)模型Gemini Embedding 2,这是这家科技巨头推出的最新模型,可将文本、图像、视频、音频和文档映射到一个统一的嵌入空间中。

谷歌在一篇博客文章中表示:“Gemini Embedding 2将文本、图像、视频、音频和文档映射到一个统一的嵌入空间,并能在100多种语言中捕捉语义意图。” “这简化了复杂的处理流程,并增强了多种多模态下游任务——从检索增强生成(RAG)和语义搜索,到情感分析和数据聚类。”

作为Gemini系列AI模型的最新成员,该模型支持最多8192个文本输入token;每次请求可处理最多6张图像,支持PNG和JPEG格式;可处理最长120秒的视频,支持MP4和MOV格式;能够直接摄取并嵌入音频数据而无需转录;并且可以直接嵌入最长6页的PDF文档。

谷歌补充称:“Gemini Embedding 2不仅仅是对传统模型的改进。”在将其与亚马逊(AMZN.US)、Voyage模型以及谷歌其他模型进行比较时,谷歌表示:“它为多模态深度树立了新的性能标准,引入了强大的语音能力,并在文本、图像和视频任务中超越领先模型。这种可衡量的性能提升以及独特的多模态覆盖能力,使开发者能够获得满足其多样化嵌入需求的一切工具。”

APP下载
广告
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。如该文标记为算法生成,算法公示请见 网信算备310104345710301240019号。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-