首页 - 财经 - 国内经济 - 正文

新V观海外:谷歌NotebookLM突围ChatGPT形态路线

来源:经济观察报 2024-10-04 09:46:27
关注证券之星官方微博:

(原标题:新V观海外:谷歌NotebookLM突围ChatGPT形态路线)

陈沛/文 谷歌的AI笔记产品NotebookLM最近新增了处理音频视频文件的功能。随后,这次产品更新获得了前OpenAI创始团队成员Andrej Karpathy关注,认为它给人一种当年ChatGPT出现的相似感,可能会开启新的AI模型产品形态。

NotebookLM的实际体验更适合科研学习场景

NotebookLM是谷歌实验室(Google Labs)此前已经推出的AI笔记产品。主要功能是用户上传PDF等格式的文档,或者直接输入谷歌在线文档、在线幻灯片、网页等网址,然后通过AI进行内容总结。用户可以自行提问,让AI针对上传的文档或输入的在线文档内容进行回答。

而这次最新更新是增加了多模态输入功能。用户在以上输入功能的基础上,现在可以上传MP3音频文件,或者直接输入YouTube在线视频的网址。

在输出方面,NotebookLM的主要亮点是可以把输入文档直接输出成两人对话聊天的音频文件,目前仅支持英语音频。此外,NotebookLM还提供了常见的AI内容总结模板,例如摘要、学习指南、简报、知识问答等,同时继续支持用户自行提问。

因此,从我实际使用体验来看,NotebookLM更适合的是科研学习场景。例如学生可以上传上课录音快速总结知识点、研究者可以把论文转成听书文件对外宣传、老师可以根据在线教学视频生成知识点和考题等。

NoteBookLM的多模态新功能其实并非首创

NoteBookLM这次更新的多模态新功能其实并非首次出现。在谷歌实验室的其它产品中已经出现过YouTube在线视频总结功能,而不久前的Google Illuminate产品也发布过将PDF学术文档转成两人对话音频文件的功能。

特别是在NoteBookLM此次更新多模态功能后不久,新加坡政府科技局(GovTech)的Gabriel Chua很快在HuggingFace上推出了开源版Open NoteBookLM,使用了开源模型Llama 3.1-405B和文本转语音框架MeloTTS,实现了将PDF转成对话音频文件的核心功能,而且在生成音频的语言风格和时长方面提供了更多选项,且能够支持中、英、法、日、韩、意等多种语言。

尽管在我实际使用开源版Open NoteBookLM的过程中,发现它的生成结果并没有谷歌NoteBookLM那么稳定,且排队等待时间长达5至10分钟。但Open NoteBookLM的快速出现至少可以佐证,多模态新功能是很快能被开源界所追上的。

NoteBookLM启示了AI应用的新路线

既然在功能层面的独创性不足,那为什么NoteBookLM这次更新还会引发诸多业界关注,甚至与当年ChatGPT的出现相提并论?这或许是因为NoteBookLM可能会启发AI应用的新路线。

自从ChatGPT出现以来,后续多数生成式AI都以聊天作为主要的产品形式。久而久之,这种对话问答形式出现的信息引用来源不准、生成内容“AI味太重”、问答结果难以核实等问题,也开始影响用户体验。

而NoteBookLM自一开始的定位就是AI笔记产品,由用户提供想进一步了解的知识来源,NoteBookLM回归AI助手的角色,甚至不需要用户漫无目的地聊天输入,就能准确高效地整理和组织各种形式的知识内容。

在这种路线下,AI产品的关注点不仅是为了和用户进行自然对话,而是聚焦对知识条理的组织和整理,甚至是不同模态知识的任意转换,有可能成为新的AI模型产品主流形态。

微信
扫描二维码
关注
证券之星微信
APP下载
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-