谷歌的I/O大会在MarcRebillet技术嘉年华之后开始,重点关注人工智能,特别是谷歌的人工智能:Gemini。如果说2023年是“人工智能”飞速发展
的一年,那么2024年将是让(谷歌的)人工智能进入每个人的手中、家庭和头脑的一年。谷歌首席执行官桑达尔·皮查伊(SundarPichai)强调,如今谷歌20亿用户的所有产品都使用Gemini。正如皮查伊所说,这只是一切的开始:
谷歌以一项重大公告拉开了I/O2024活动的序幕:计划在本周内向美国用户推出其搜索生成体验(SGE)实验室功能。
AIOverviews将自动回答美国的特定搜索,在搜索结果页面顶部的传统链接列表之前提供简洁的解释。在接下来的几天里,美国数亿用户将体验人工智能概述,并计划在今年年底之前扩展到全球超过10亿用户。
很快,您将能够通过选项来调整AI概述,以简化语言或更详细地分解它。如果您对某个主题不熟悉,或者您想简化某些内容以满足孩子的好奇心,这可能特别有用。
人工智能概述将有助于解决日益复杂的问题。您无需将问题分解为多个搜索,而是可以一次性提出最复杂的问题,以及您想到的所有细微差别和注意事项。
例如,也许您正在寻找一家新的瑜伽或普拉提工作室,并且您想要一家受当地人欢迎、交通便利且还为新会员提供折扣的工作室。很快,只需进行一次搜索,您就可以提出诸如“找到波士顿最好的瑜伽或普拉提工作室,并向我展示他们的介绍优惠的详细信息,以及从灯塔山出发的步行时间”之类的问题。
除了为复杂问题找到正确的答案或信息之外,搜索还可以与您一起制定计划。
借助搜索中直接的规划功能,您可以帮助您根据需要制定计划,从用餐和假期开始。搜索诸如“为一组易于准备的3天膳食计划”之类的内容,您将获得来自网络的各种食谱的起点。
谷歌Gemini新功能和特性
随着视频理解的进步,您现在可以使用视频进行搜索。例如,如果您在旧货店购买了一台电唱机,并且臂意外漂移,您可以简单地通过问题视频进行搜索。这使您无需尝试用文字描述问题,并提供包含故障排除步骤和资源的AI概述。
Gemini正在进一步进照片应用程序,它很快就能完成您指定的任务。
在接下来的几个月中,GooglePhotos将引入上下文感知的语音和文本提示,以帮助用户搜索特定图像或图像中的细节。“询问照片”功能利用Gemini识别图像内容,超越了传统的图像搜索。例如,它可以检测汽车牌照,并提示用户查询特定车型的特定车牌号,从而提供准确的识别。
AskPhotos的推出预计将在未来几个月内开始,暂定发布时间为夏季。
皮查伊还透露,Gemini1.5Pro是其人工智能模型的最新版本,现在所有用户都可以通过GeminiAdvanced应用程序访问。公共版本带有100万个代币的上下文窗口。此外,谷歌还升级了Gemini1.5Pro,以处理200万个代币,但此功能将仅限于开发者在私人预览版中使用。
在人工智能中,代币就像一个构建块或一块拼图。它是一个小的信息单元,代表有意义的事物,例如单词或句子的一部分。令牌通过将语言分解为可管理的片段来帮助人工智能理解和处理语言,使计算机更容易分析和生成文本。
Gmail中的Gemini提供全面的搜索功能,可在方便的侧边栏中汇总您的整个电子邮件历史记录,从而彻底改变电子邮件管理。
从今天开始,Gmail、文档、云端硬盘、幻灯片和表格的侧面板中的Gemini将使用Gemini1.5Pro。凭借更长的上下文窗口和更高级的推理,双子座可以回答更广泛的问题并提供更有洞察力的答案。另外,通过侧面板中显示的摘要、建议的提示等内容可以轻松开始使用。
该解决方案解决了筛选大量电子邮件以查找相关信息的常见问题。借助Gemini,用户可以简单地请求特定联系人的电子邮件摘要,接收关键详细信息的简明要点列表,并快速访问原始电子邮件。在一分钟的演示中,谷歌展示了用户如何直接从Gemini侧边栏快速回复电子邮件,从而简化了沟通过程。