产业观察 2025.06.05 【AI产业跟踪】Google发布基于Gemma模型的变体,iOS19或将迎来12年最大更新 摘要:产业最新趋势跟踪,点评产业最新风向 AI行业动态 英伟达全新GPU曝光 阿联酋让全民免费用ChatGPTPlus 云计算与SaaS巨头Informatica收购InformaticaSpAItial集结Meta谷歌豪华技术团队 AI应用资讯 3D大模型初创VAST推出的TripoStudio四功能升级AIScientistZochi的论文通过顶会同行评审Anthropic为Claude推出语音模式 AKOOL发布全球首款实时摄像头AKOOLLiveCamera 法国机构Kyutai宣布推出UnmuteVeo3开放使用大量实测演示OpenAIo3模型单挑Linux内核 AI大模型资讯 两位自动驾驶大牛创业世界模型Google发布基于Gemma模型的变体资深研究员回应Claude4思考方式 AI科技前沿 波士顿动力机器人具备3D感知+实时追踪能力 iOS19或将迎来12年最大更新 全球首个AI科学家天团2.5个月找到治盲新药风险提示 AI软件销售不及预期,capex投资计划变动,AI产品及大模型研发不及预期等。 产业研究中心 李嘉琪(分析师) 登记编号S0880524040001 021-38676666 刘峰(研究助理) 登记编号S0880124060013 021-38676666 目录 1.AI行业动态3 2.AI应用资讯3 3.AI大模型资讯4 4.科技前沿5 5.风险提示5 1.AI行业动态 英伟达全新GPU曝光 据新智元公众号5月25日消息,英伟达因美国出口管制在中国AI芯片市场份额 从95%暴跌至50%,被国产芯片抢占市场。为应对困局推出新款阉割版BlackwellGPU,售价6500-8000美元,远低于H20的1-1.2万美元。新芯片采用GDDR7内存技术,内存带宽约1.7TB/秒,以符合出口管制限制要求。 阿联酋让全民免费用ChatGPTPlus 据看中东的DeepMENA公众号5月27日消息,阿联酋将成为全球首个让全民免 费使用ChatGPTPlus的国家,这是OpenAI与阿联酋政府合作的一部分。阿布扎比将建设StargateUAE高性能AI数据中心,支持1千兆瓦计算集群,初期目标200兆瓦容量。此合作属于OpenAI"面向国家"计划,阿联酋承诺匹配美国同等资 金,投资总额可能高达200亿美元。 云计算与SaaS巨头Informatica收购Informatica 据智东西公众号5月28日消息,Salesforce以80亿美元收购云数据管理龙头 Informatica,为其自2021年收购Slack后最大交易。此次收购将整合双方AI引擎,打造可信数据基础架构,支持代理式AI系统的企业级部署。数据管理能力成为企业AI产品的关键差异化优势,Salesforce通过收购完善其数据管理领域布局。 SpAItial集结Meta谷歌豪华技术团队 据ZPotentials公众号5月28日消息,SpAItial获1300万美元种子轮融资,由前 Synthesia联创马蒂亚斯·尼斯纳创立,专注于文本生成逼真3D环境技术。公司组建了来自Meta和谷歌的豪华技术团队,目标是创造不仅逼真而且可交互的3D世界,与Odyssey和WorldLabs等竞争。团队瞄准游戏开发、娱乐产业和建筑可视化等应用场景,远期目标包括让普通用户快速创建游戏及可能取代CAD软件。 2.AI应用资讯 3D大模型初创VAST推出的TripoStudio四功能升级 据量子位公众号5月29日消息,VAST升级TripoStudio,推出四大核心功能:智 能部件分割、贴图魔法笔刷、智能低模生成和万物自动绑骨,实现从"给模型"到"交成果"的质变。智能部件分割实现一键拆建,可精准识别模型各部分;贴图魔法笔刷简化贴图修复流程;智能低模生成在保留细节前提下大幅减少面数。万物自动绑骨功能能识别各类生物力学特征并快速完成骨骼权重分配,非专业人士也能完成全流程3D创作,效率提升10倍以上。 AIScientistZochi的论文通过顶会同行评审 据机器之心公众号5月29日消息,AI科学家Zochi的论文被顶会ACL主会录 用,成为首个独立通过A*级别会议同行评审的AI系统,Beta测试同日上线。Zochi的论文《Tempest:基于树搜索的大型语言模型自主多轮越狱》展示了其多轮攻击方法,在GPT-3.5上成功率达100%,GPT-4上达97%。Zochi能自主完成从文献分析到同行评审的科学研究过程,论文质量高,但其公司曾引发学术界对科学同行评审过程被滥用的批评风波。 Anthropic为Claude推出语音模式 据ZPotentials公众号5月28日消息,Anthropic推出Claude语音模式,用户可 通过语音讨论文档和图片,并可从�种独特音色中选择。用户能在文本与语音间自由切换,对话结束后可查看文字记录和摘要。该功能有使用限制,语音对话计入常规使用上限,其中配套接入的GoogleWorkspace连接器仅对付费用户开放。 AKOOL发布全球首款实时摄像头AKOOLLiveCamera 据新智元公众号5月28日消息,AKOOL发布全球首款实时摄像头AKOOLLive Camera,能低延迟实现虚拟数字人、多语言翻译、人脸替换和AI视频生成。该技术突破传统文生视频限制,通过4D面部映射、神经语音引擎等技术实现环境感知和情感响应,94%盲测无法区分真假。该产品标志AI视频从"预制化"进入"智能化响应"时代,被誉为继Sora后的第二次AI视频革命。 法国机构Kyutai宣布推出Unmute 据创意Ai实验室公众号5月27日消息,法国非营利AI研究机构Kyutai推出 Unmute,一款模块化语音AI系统,可为任何文本LLM快速添加语音交互功能。Unmute具备低延迟(200-350毫秒)、流式语音转文本和文本转语音、全双工交互、10秒语音克隆等功能,支持70+情感风格。Kyutai承诺未来几周内完全开源Unmute,包括STT(1B参数)、TTS(2B参数)模型和代码,支持PyTorch、MLX和Rust实现。 Veo3开放使用大量实测演示 据APPSO公众号5月24日消息,GoogleI/O发布的Veo3视频生成模型实现了流 畅真实的动画效果和同步音效,解决了物理逻辑问题。Veo3能精确呈现复杂场景细节,包括流体动态、质感表现和人物动作,支持多种镜头风格和特效。作为创意工具,Veo3已达近电影级画质,支持非语言音效和多语言旁白,但也引发了真假视频难辨的讨论。 OpenAIo3模型单挑Linux内核 据AI寒武纪公众号5月25日消息,OpenAIo3模型在Linux内核SMB实现中发 现远程0-day漏洞CVE-2025-37899,基准测试表现优于ClaudeSonnet3.7。研究员用3.3k行代码测试,o3在100次运行中8次成功识别已知漏洞,误报率约1:4.5,展现合理信噪比。o3独立发现新UAF漏洞且洞察力超越人类专家,能指出修复方案不足,标志着LLM在漏洞研究领域达到实用水平。 3.AI大模型资讯 两位自动驾驶大牛创业世界模型 据量子位公众号5月29日消息,自动驾驶大牛OliverCameron和JeffHawke创 立Odyssey,推出世界模型实现视频实时生成,速度达40毫秒/帧,支持实时交互。该技术区别于传统视频模型,通过真实生活视频学习像素和动作,采用窄分布模型架构解决自回归建模挑战,无需游戏引擎即可实现持续生成。Odyssey已获2700万美元融资,当前预览版由H100GPU集群支持,输出30FPS的5分钟连贯交互视频,用户可免费体验,开启世界模型的新阶段。 Google发布基于Gemma模型的变体 据程序员老鬼公众号5月26日消息,Google发布三款基于Gemma的模型变体: MedGemma、SignGemma和DolphinGemma,分别面向医疗、手语和动物语言领域。MedGemma包含4B多模态模型和27B文本模型,能处理医学图像分类、报告生成和临床文本推理,可在单GPU上运行。SignGemma用于手语翻译,DolphinGemma则是400M参数模型,用于预测和生成海豚语言信号。 资深研究员回应Claude4思考方式 据量子位公众号5月24日消息,Claude4采用可验证奖励强化学习(RLVR)范式, 在编程和数学等有清晰反馈信号的领域取得突破。当前AIAgent发展受限于高可靠性不足,但预计2026年将出现能独立完成实际工作的软件工程Agent。研究员预测到2026年底,AI将具备足够的"自我意识",能执行复杂任务并判断自身能力边界。 4.科技前沿 波士顿动力机器人具备3D感知+实时追踪能力 据量子位公众号5月29日消息,波士顿动力Atlas机器人重磅升级,具备3D空 间感知和实时物体追踪能力,可360°旋转头部和腰部,在汽车工厂中执行复杂工业任务。技术核心包括2D物体检测系统(识别边界框和关键点)、基于关键点的3D空间定位以及SuperTracker物体位姿跟踪系统,能应对物体遮挡和位置变化情况。系统融合运动学数据、视觉数据和力反馈,通过"渲染-比较"方法估计位姿,实现精确手眼协调,团队正致力于构建统一基础模型,推动感知与动作融合。 iOS19或将迎来12年最大更新 据三次方AIRX公众号5月26日消息,苹果将在WWDC2025发布iOS19等系 统的重大设计更新,代号"Solarium",这是自iOS7以来最大规模的视觉更新。新设计语言借鉴visionOS元素,将使用更多透明度效果、新图标和修订导航方式,实现跨设备和操作系统的视觉统一性。更新将涵盖iOS、macOS、watchOS和tvOS等系统,可能特征包括FrostedGlass元素、更圆润的"squircle"图标和浮动UI元素。 全球首个AI科学家天团2.5个月找到治盲新药 据新智元公众号5月24日消息,世界首个AI科学家团队在2.5个月内发现治疗 干性老年性黄斑变性(dAMD)的新药Ripasudil,这是一个实际的科学发现。团队开发的Robin多智能体系统自动化了科学发现全过程,结合Crow、Falcon和Finch智能体完成文献检索、实验设计和数据分析。AI发现了人类未曾想到的治疗路径,完全主导研究框架,人类仅执行实验,展示了AI驱动科学发现的新范式,即将开源Robin系统。 5.风险提示 AI软件销售不及预期,capex投资计划变动,AI产品及大模型研发不及预期等。受AI产业链新建产能变化影响,及全球AI软件销售不及预期,或因上下游芯片产出及量产能力限制,影响产业产品研发情况。 本公司具有中国证监会核准的证券投资咨询业务资格 分析师声明 作者具有中国证券业协会授予的证券投资咨询执业资格或相当的专业胜任能力,保证报告所采用的数据均来自合规渠道,分析逻辑基于 作者的职业理解,本报告清晰准确地反映了作者的研究观点,力求独立、客观和公正,结论不受任何第三方的授意或影响,特此声明。 免责声明 本报告仅供国泰海通证券股份有限公司(以下简称“本公司”)的客户使用。本公司不会因接收人收到本报告而视其为本公司的当然客 户。本报告仅在相关法律许可的情况下发放,并仅为提供信息而发放,概不构成任何广告。 本报告的信息来源于已公开的资料,本公司对该等信息的准确性、完整性或可靠性不作任何保证。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值及投资收入可升可跌。过往表现不应作为日后的表现依据。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。本公司不保证本报告所含信息保持在最新状态。同时,本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。 本报告中所指