行业事件: 美国时间12月6日,谷歌CEO桑达尔﹒皮查伊宣布Gemini 1.0版正式上线,新模型包括能力最强的Gemini Ultra、适应多任务的Gemini Pro以及针对特定任务和端侧的Gemini Nano三个版本,新模型多项能力行业领先。 Gemini是原生多模态大模型 Gemini在预训练阶段就基于多模态进行训练,原生支持多模态能力,并利用额外的多模态数据进行微调,因此Gemini可以泛化并无缝理解、编辑和整合不同模态的信息,包括文本、代码、音频、图像和视频,可以全面理解输入的信息,且能够回答与复杂主题相关的问题。 Gemini多项能力全面提升 推理方面,Gemini 1.0具有复杂多模态推理能力,可以帮助理解复杂的文本和图像信息,能够从海量数据中精准提取关键信息,因此,Gemini 1.0这种通过阅读、过滤和理解信息的超强能力有望推动科学、金融、数学等诸多领域快速创新突破。编码方面,Gemini可以理解、解释和生成流行编程语言(如Python、Java、C++、Go)的高质量代码,具备强大的跨语言工作和推理复杂信息的能力使其成为世界领先的编码基础模型之一。三个版本的能力大幅提升和拓展,Gemini Ultra在大型语言模型研发被广泛使用的32个学术基准测试集中,在其中30个测试集的性能超过当前SOTA结果,同时在大规模多任务语言理解数据集中得分率高达90%,首次超越人类专家。Gemini Pro在各种任务上的扩展表现最佳,也将集成到Bard中并继续免费。Gemini Nano则在端侧表现优异,将首先在谷歌Pixel手机上运行。 谷歌旗下产品能力有望全面升级 谷歌将在其相关产品中全面集成Gemini的能力,包括搜索、广告、Chrome、DuetAI等。在Gemini Pro加持下Bard将迎来重大升级,可执行更高级的推理、规划、理解等任务,且升级版的Bard将在170多个国家和地区提供英语版,后续将扩展到更多模态并支持多种语言。谷歌搜索在Gemini的加持下能力也大幅提升,测试显示它使用户的生成搜索体验(SGE)速度更快,延迟减少40%,同时质量也得到提升。 投资建议 我们认为谷歌Gemini大模型是AI大模型领域的重大进步,有望推动整个产业快速发展,加速AI应用落地。建议关注谷歌产业链以及在AI应用落地方面全面布局且业绩表现亮眼的公司昆仑万维、美图公司。 风险提示:AI应用落地不及预期风险;竞争加剧风险;安全、伦理风险。