面对来自OpenAI和其他竞争对手日益激烈的竞争,谷歌(Google)母公司Alphabet周二展示了其如何在各业务领域建立人工智能基础,包括增强的Gemini聊天机器人和搜索功能的改进。
在加州山景城举行的年度I/O开发者大会上,首席执行官桑达尔·皮查伊表示,自去年以来,经过长时间的公开测试,该公司将于本周向美国所有用户推出人工智能概述。
周二公布的人工智能新功能将帮助投资者评估Alphabet在与微软(Microsoft)、OpenAI和其他竞争对手争夺这一新兴技术主导地位之际取得的进展。
3
在产品发布会期间,Alphabet的股价攀升,周二下午最后上涨约1%,至172.50美元。
“我们还处于人工智能平台的早期阶段,”皮查伊说。
谷歌宣布对其Gemini Pro 1.5模型进行改进,该模型能够理解大量数据。
周二,谷歌表示,它将把这个数字翻倍,达到200万个代币,这意味着人工智能有可能在输入数千页文本或一个多小时的视频时回答问题。
Pro模式——从提示大小高达100万令牌或数据片段开始——也将提供给谷歌双子座高级服务的订阅者。
OpenAI和谷歌之间激烈竞争的另一个迹象是,这家在线搜索领导者展示了Veo,这是一款人工智能模型,据称它是迄今为止最强大的,可以通过简单的文本命令创建视频。
谷歌早在今年1月就发布了一项视频生成技术,但几周后就被OpenAI的Sora抢去了风头。
这家ChatGPT的制造商在好莱坞高管中推广了它的电影魔术软件,吸引了创意产业的关注,也让他们感到担忧。
谷歌表示,电影制作人唐纳德·格洛弗(Donald Glover)已经对其人工智能进行了试验。
该公司还预览了一款新的文本到图像模式Imagen 3,并宣传了与其他艺术家的合作。
3
该公司宣布了一款名为1.5 Flash的缩小版Gemini,旨在降低部署人工智能的成本并加快响应速度。
与功能更强大的版本一样,Flash可以接收大量数据,同时针对聊天应用、视频和图像字幕进行了优化。
AI Overviews使用生成式AI来合成信息并回答更复杂的查询,这些查询在Web上没有简单的答案。
3
Alphabet旗下的人工智能部门谷歌深度思维(Google DeepMind)一直致力于开发能够为消费者执行日常任务的技术。
早期的成果在Project Astra中得到了体现,这是一个可以使用智能手机摄像头得出关于周围世界的结论的工具。
在谷歌I/O大会上播放的一个演示视频中,一名用户使用它来识别说话者,并定位他们放在房间另一端的眼镜。
微软支持的OpenAI周一展示了一种名为gpt - 40的新型人工智能模型,该模型使ChatGPT能够通过语音实时响应并被打断——这两个特征都是现实语音对话的标志,而谷歌助手等人工智能语音助手发现这是一个挑战。