谷歌搜索免翻墙入口
【新智元导读】在这场如火如荼的AI军备竞赛中,谷歌在年底彻底打响翻身仗,成功逆袭!Google Cloud于近日也发布了一份44页「2024 数据和AI趋势报告」,直指AI智能体、多模态AI,企业搜索将成为2025年三大主导技术。
在被公认是下一个AI前沿的智能体领域,谷歌的Project Mariner,可以直接让Gemini控制我们的浏览器,自行执行任务!直接一步跨越到人机交互的未来。
惊人之处在于,Mariner是一个真正可以在浏览器上完成复杂任务而不会失败的AI。预定航班、定餐馆,它都可以通过在屏幕上看到的内容完成操作。
受邀参加项目测试的Linus Ekenstam表示,这一天很快就会到来:人手一个AI私人助理,而且它们无所不在。
更不用说,就在昨天放出的AI视频模型Veo 2.0,无论是在物理学、质量还是指令遵循上,效果都妥妥吊打Sora,全网测试,为之疯狂。
早在2017年,Sam Altman在一次邮件交流中就明确表示,谷歌DeepMind是在AGI竞争中最大的对手。
当时,他还未能预见其他玩家会加入这场竞争。不过,估值180亿美金Anthropic的崛起,证明了新玩家也能翻身成巨头。
Meta通过「开源」(虽然并非真正的开源)另辟蹊径,避免了与谷歌占据主导地位路线的直接竞争。
ChatGPT如同一匹黑马,自2022年横空出世以来,OpenAI一直牢牢掌握着AI的话语权。与此同时,ChatGPT成为了「AI」的代名词。
最初的几轮交锋中,谷歌试图通过Gemini去挽救落下的成绩,并期望以此获得市场青睐,但总是未能如意。
更耐人寻味的是,OpenAI几乎毫不费力,每次都能在谷歌发布新产品前后抢尽风头。即便在模型推理能力上,到目前为止,OpenAI也一直是遥遥领先。
人们不理解的是,谷歌DeepMind拥有世界上最好的资源,为什么会在这场竞争中略显得仓促和被动?
与OpenAI不同,他们有大量用于训练推理的TPU、更多的训练数据(比如YouTube),以及DeepMind这个世界级研究机构和顶尖人才。
DeepMind团队也在努力用实力,去证明这一切。在科学领域,AlphaFold、GenCast等等,取得了难以置信的成就。
今天,Google Cloud发布的一份44页「2024 数据和AI趋势报告」,直指AI智能体、多模态AI,企业搜索将成为2025年三大主导技术。
当前,智能体已经能够独立完成多步骤任务,而只有约10%的大公司已经采用,另外82%公司计划三年内将智能体整合到工作流中。
谷歌云全球GenAI副总Oliver Parker表示,「不久的将来,你会看到不同智能体之间相互频繁地交流协作」。
- 面向客户的智能体:用于了解客户需求、回答与解决问题并推荐相应的产品和服务。它们支持跨多模态工作,可以分析语音与视频内容
「我们认为一个巨大的机会即将到来,那就是一个能够管理协调你各种智能体的平台」,他讲道,这将会催动「智能体管理」或者需要一个支持 「在不同系统中的任何地方都能提供不同服务的智能体层」。
多模态人工智能将人工智能的理解能力提升到一个新的水平,使模型能够解读和处理一系列数据源,不仅包括文本,还包括图像、视频和音频。
目前一些主要的供应商和前沿的初创公司已经发布了许多功能强大的多模态工具,例如谷歌自己的Gemini 2.0 Flash、Mistral的Pixtral 12B或Cohere的Embed 3。谷歌预测,多模态人工智能的爆发将支持复杂的数据分析,并为人们带来对于事物更深刻的基本认识和更个性化的见解。
Parker指出,在过去的12个月里,企业已经从单一模型转变为针对不同的场景去部署多个模型,如Gemini、Anthropic、Mistral、Cohere、Llama等,而不仅仅是OpenAI模型。
虽然当前谷歌云的重点依然大多在开发上,但2025年的目标则是让企业级用户自己掌握生成式人工智能能力。
目前企业已经不仅仅只是关注模型本身,而且开始分析不同的部署平台并制定人工智能和智能体的规划发展路线图。Parker对此表示,这些通常是几年内才能看到的趋势,但在12个月内就快速呈现了,令人惊叹。
你可以使用图像、音频、视频或者是对话提示来快速查询访问企业内部数据。毫无疑问,这将让搜索变得极其丝滑。
在实际工作中,人们往往是搜寻到相应信息并将其整合以获得见解,做出相应决策,进而采取行动。由于许多组织的不同信息通常分散在不同的应用程序中,而人工智能搜索可以快速跨越这些应用程序将数据整合在一起,这就彰显了结合生成式人工智能的企业搜索的巨大优势。
谷歌云产品管理高级总监Ryan J. Salva表示,这个想法是为编码任务扩展更多的上下文,而不中断工作流程。
开发者只需进入Code Assist聊天页面,说明需要处理的数据,然后LLM可以自动从数据源查询并对其分析。
为了给开发者们提供便捷,谷歌计划未来还将更多工具,直接集成到Gemini Code Assist中,比如可观察性工具、安全软件以及数据库。
从ChatGPT可以协助编码之后,人工智能编码助手是GenAI的首批重要用例。GitHub、甲骨文、Harness纷纷推出了以企业为重点的编码助手。
与此同时,OpenAI和Anthropic对外提供API接口,让程序员直接在聊天平台上编程。
比如,我们可以直接在ChatGPT中的Canvas运行Python代码谷歌搜索免翻墙入口,还能进行交互性的编辑生成。
据Gartner估计,「截止2028年,90%的企业软件工程师将使用AI编码助手,这一比例在2024年初还不到14%」。
谷歌宣称,Gemini Code Assist企业版已超越了IDE中的AI编码辅助功能,不仅可以理解本地代码库,还可以定制代码,提供代码建议。
它的定制功能可索引来自GitHub和GitLab的repos,并将于2025年初支持其他源码控制系统和自托管的内部repos。
同时,它还能完成复杂的任务,如在整个软件包中升级Java版本。此外,企业版提供了企业级安全以及法律赔偿条款。