会议时间:2023年5月11日 参会人员:CEOSundarPichai、Sissie等会议纪要 欢迎来到谷歌I/O大会,非常高兴能够在海岸线圆形剧场看到这么多的开发者,同时也很激动的看到从孟加拉到巴西,再到我们隔壁的新湾景园园区,全球有数百万开发者共同参加今天大会,对此我深感表现非常感激,一如既往和他在一起,我感到非常的开心。 或许大家都已经听说了,AI在过去一年被频繁提及,所以今天有很多内容要和大家分享,那我们开始谷歌已经走过了7年“AI为先”的旅程,现在正处在一个激动人心的拐点之中,我们有机会可以让AI为个人,为企业,为社区以及每一个人都来带来更多的帮助。 在过去的一段时间里,我们已经运用AI,让我们的产品更加有用。随着生成式AI的出现,我们迈出了下一步,以大胆且负责任的方式,我们重新构想了所有的核心产品,包括搜索,稍后大家会在主题主题演讲当中了解更多的内容,让我们用一些例子来说明生成式AI是如何帮助我们提升产品的,首先我们先从邮件开始。 【AI与Google产品】1.Gmail邮件推出“Helpmewrite”功能 2017年我们推出了smartreply智能回复,只需轻击鼠标就可以选择简短的回复 。接下来我们也推出了smartcompose智能撰写功能,可以在用户打字的时候提供写作建议。smartcompose不断的完善,实现了由AI驱动的更先进的协作功能,并且在过去一年当中在voicebase当中就被使用了超过1,800亿次。现在通过更强大的生成式模型,我们在Gmail中实现了更先进的功能,推出了helpmewrite帮我写功能。 假如我们收到一封电子邮件提示说你的航班被取消了,航空公司给你发一张代金券,但你真正想要的就是全额退款,你可以使用帮我写功能来进行回复,只需要输入你想要的提示信息“一封要求全额退款的电子邮件”,然后点击创建一份完整的草稿就会出现了。正如大家所看到它非常方便的从上一封邮件当中提取到了航班,详情看起来非常接近你想要发送的内容了,或许你可能想进一步完善它,在这种情况之下,一封更详细的电子邮件可能会增加获得退款的机会,我觉得就可以发出去了。我觉得这封邮件写的不错,可以发了。所以帮我写这个功能其实将会被我们Workspace带来新的功能或作为更新的一部分推出 ,就像smartcompose一样,随着时间的推移它会变得越来越好。 2.GoogleMaps新增沉浸式路线视图ImmersiveViewforroutes 自推出StreetView以来,AI已经将数10亿张全景图片拼接在一起,让人们可以在自己的设备上探索世界。在去年的I/O大会上,我们又推出了沉浸式视图,即利用AI创建一个地方的高保真地图,让用户可以在到达之前就先获得身临其境般的体验。 现在我们正在将同样的技术扩展到GoogleMaps最擅长的领域——帮助用户到达目的地。Maps每天提供200亿公里的路线指引。现在,通过沉浸式路线视图(ImmersiveViewforroutes),无论你是步行、骑车还是驾车,都可以实现这一点。 假设我在纽约,我想骑自行车出去玩一下,Maps给了我一些路线的选择。选择靠海滨这条路线,点击沉浸式路线视图,即可体验一种全新的旅程视角。缩放地图可以获得很棒的鸟瞰视图,或体验在自行车道上行驶。同时还可以了解今天的空气质量、交通和天气情况,并了解它们未来可能的变化。沉浸式路线视图将在夏季推出,并在今年年底前在15个城市上线,包括伦敦、纽约、东京和旧金山等。 3.Googlephotos将引入MagicEditor功能 另一个通过AI得以提升的产品就是Googlephotos。我们在2015年的I/O大会上推出了这样一个产品,它也是我们首批AI原生产品之一。得益于机器学习技术的突破,它让用户能够在照片当中搜索人物、日落或者是瀑布等的元素。事实上,每个月有17亿张图片在Googlephotos上被编辑。我们已率先在pixel上推出了MagicEraser魔法橡皮擦,可以使用AI驱动的计算摄影来消除不必要的一些干扰。 今年晚些时候,我们会推出结合语义理解和生成式AI的MagicEditor魔法编辑器,它可以实现移除照片中的部分内容、改善光线、改变云层、改变人物的位置和姿势等。MagicEditor会自动重现原始照片当中没有捕捉到的长凳和气球的部分那作为点睛之笔,你可以把天空再调高一点,也会改变照片其他部分的光线,所以使得编辑感觉更连贯一致。确实就像魔法一样,我们很高兴能够在今年晚些时候推出MagicEditor。 【普惠AI的使命】 我们对于未来的机会感到非常的兴奋,我们让AI惠及每一个人的能力,就在于不断推进我们的基础模型。因此接下来我想花一点时间来分享我们是如何实现的。从Gmail和Photos到Maps,这些只是AI如何在重要时刻提供帮助的几个例子。我们还可以做更多的事情,在你熟悉和喜爱的产品中充分挖掘AI的潜力 。今天,我们有15个为个人和企业提供帮助的产品用户数都超过了5亿,其中6个产品的用户数已超过了20亿。这给了我们很多机会来践行我们的使命——整合全球信息,供大众使用,使人人受益。 这是一个永恒的使命,随着时间的推移,它变得越来越重要。展望未来,让AI惠及每一个人是我们推进这一使命最深入的方式。我们正通过四个重要方法来实现这一目标:首先,通过提升用户的知识和学识,加深他们对世界的理解。第二,通过提高创造力和生产力,帮助用户表达自己并把事情做好。第三,通过赋能开发者和企业,帮助他们打造具有变革性的产品和服务。最后,通过负责任地创建和部署AI,使每个人都能平等受益。 【PaLM2与Gemini】1.公布全新的大型语言模型PaLM2,力争与GPT-4对抗 PaLM2建立在我们的基础研究和最新的基础设施之上,在各种任务中都具有很强的能力,并且易于部署。我们今天将宣布超过25种由PaLM2支持的产品和功能。我们推出了4种不同规模的PaLM2,并亲切地将它们命名为Gecko、Otter 、Bison和Unicorn。其中,Gecko非常轻巧,可以在移动设备上工作,其速度快到足以在设备上运行出色的交互式应用程序,即使在离线的状态下。 由于对科学和数学主题进行了广泛的训练,PaLM2模型的逻辑和推理能力更强 。它还接受了100多种的多语言文本训练,因此它能够理解并生成精确的结果 。结合强大的编码能力,PaLM2还可以帮助世界各地的开发人员进行合作。假设你正在与首尔的一位同事合作调试代码。它首先识别代码是递归的,然后建议修复,并解释修复背后的原因,最后按照你的要求添加韩文注释。 尽管PaLM2功能已经非常强大,但当用特定领域的知识对PaLM2进行微调后,它的表现会更加出色。我们最近发布了针对安全用例进行了微调的Sec-PaLM 。它通过AI来更好地检测恶意脚本,并能够帮助安全专家理解和解决威胁。在医疗领域,根据PaLM2的微调模型Med-PaLM2,这种微调使得不准确的推理减少了9倍,可根据X光片分析病人伤势,已达到类临床专家水平。我很高兴地宣布PaLM2现在已经有了预览版。 2.下一代大模型Gemini,旨在实现多模态、高效和为未来创新而构建 PaLM2是我们10年以来,用负责任的方式将AI带给数10亿人的旅程中的最新进展。它建立在GoogleBrain和DeepMind两个世界顶级研究团队所取得的进展之上。回顾过去10年AI的重大突破,上述团队做出了相当数量的贡献,包括AlphaGo,Transformers和序列对序列模型等。所有这些都为我们今天所处的转折点奠定了基础。我们最近将这两个团队合并为GoogleDeepMind,利用Google的计算资源,让他们专注于创建安全和负责任的更强大系统。 这其中有我们在训练中的下一代基础模型Gemini。它从一开始就被创建为多模态、高效的工具和API集成,以支持未来的创新,如内存和规划。尽管它还处于早期阶段,但我们已经看到在以往模型中没有出现的多模态能力,这让人印象深刻。 经过微调和严格的安全测试后,Gemini将像PaLM2一样适应多重体量模式和功能,以确保它可以部署在不同的产品应用和设备上,我们一定还要去做更多负责任的一个调查。 【AI安全——水印与元数据】 随着我们不断投入能力越来越强大的模型,我们也在深入研究AI应当肩负的责任,这包括让用户拥有可识别出合成的生成式内容工具。水印和元数据是两个重要方式。水印将信息直接嵌入到内容中,即使经过适度编辑的图像,水印也能保存其中。展望未来,我们正在建立自己的模型,让水印从开始就融入其中 。如果你看到一张合成图片,发现它如此真实,令人印象深刻,这也是为什么这项责任如此重要。元数据允许内容创作者将额外的背景信息与原始文件关联 ,每当你看到一张图片时,元数据就会提供其背景信息。我们将确保,每一张由AI生成的图像都会绑定这种元数据。 随着我们投资能力更强大的模型,也要深入研究AI应当肩负的责任,包括让用 户拥有可识别出合成生成式内容的工具。水印和原数据就是两个重要的方式,水印将信息直接嵌入到内容当中,既是经过适度编辑的图像水印也能保存,其中那未来我们也在建立自己的模型,让水印从一开始就融入其中。 如果你看到这张合成图片,你会发现它非常的真实,令人印象深刻,这也就是为什么这项责任如此的重要了。原数据可以允许内容创作者将原数据与原始文件相关联,每当你看到一张图片的时候,原数据就会提供其背景信息,我们还将确保每一张由我们AI生成图像都会绑定这种原数据。 【Bard基于PaLM2的升级】 随着模型变得更好更强大,最令人兴奋的机会之一就是人们可以直接的参与其中,这就是bard带给我们的机会。我们正在迅速提升Bard,目前它已支持20多种语言的广泛的编程功能,并在推理和数学提示方面更加智能。并且,从今天起,它将完全运行在PaLM2之上。 Bard新增了代码一键导入功能,现在,你可以将Bard生成的代码直接导出到Colab。除了代码,用Bard生成的任何内容,比如电子邮件草稿、表格也都可以直接拖到Gmail、Docs和Sheets中。另外,还新增了图片问答,无论是提示还是回答都可以以照片呈现,使对话更加视觉化,比如询问旅游攻略就是一个很好的应用场景。最后,Bard还整合了AdobeFirefly以快速生成图片,并引入了深色模式。总之,Bard将能够把Google的工具和web当中所有的服务连接在一起,实现流畅的协作。 另外,Bard将取消等候名单,向180多个国家和地区开放。除了扩大访问范围 ,Bard也在英文之外,新增直接用日语和韩语对话的功能,并很快就会新增到40种语言版本。 【DuetAI赋能GoogleWorkspace全家桶,类比微软的copilot】 我们还为GoogleWorkspace带来了新功能。除了在Docs和Gmail中的“Helpmewrite”功能外,GoogleWorkspace的DuetAI提供了一些工具,在文档中能总结全文,自动编写幻灯片,能文字生成图片表格、进行数据分析、策略制定等。 1.文档:告诉DuetAI想要创作的内容,便可自动生成文章 从一开始Workspace其实就允许你和其他人进行实时协作,那现在你也可以与AI进行实时协作了。AI可以在workspace的所有应用程序当中充当教练,思想伙伴,灵感来源以及生产力助推剂。我们和AI协同的第一步就是在Gmail和docs当中加入了帮我写功能,该功能于3月份在首批测试用户当中已经进行测试了 ,这个功能巧妙和创造性的使用方式震撼了我们所有人,因为它可以帮助我们写文章,做销售展示,写项目计划,做客户拓展文案等等。从那时候起,我们就致力于将这些有用的功能拓展到更多的使用场景,那给大家举几个例子。 我们最受欢迎的用例之一那就是写一个职位描述,每个企业无论是大小都需要去招聘人员,一个好的职位描述,可以让招聘工作更加的高效。那我们来看一下docs是如何帮助我们