行业研究 证券研究报告 计算机2024年05月17日 AI专题系列(十八) OpenAI发布GPT4o:AI应用或加速落地 推荐(维持) 华创证券研究所 证券分析师:吴鸣远 邮箱:wumingyuanhcyjscom执业编号:S0360523040001 联系人:张宇凡 邮箱:zhangyufan1hcyjscom 行业基本数据 占比 2023051720240516 21 1 1923052307 40 2310 231224032405 计算机 沪深300 相关研究报告 《计算机行业2023年与2024Q1业绩综述:板块业绩走出低谷,ToG端持续承压》 20240516 《AI专题系列点评(十七):DeepSeek发布第二代MoE模型,降本增效有望加速AI应用普及》 20240514 《计算机行业2024年Q1基金持仓分析:基金持仓处于相对低位,环比变动幅度较大》 20240513 事项: 2024年5月14日,OpenAI发布了新一代生成模型GPT4o及其桌面应用程序。GPT4o(“o”代表“omni”)是OpenAI最新的旗舰型号,不仅具备与GPT4同等的强大模型能力,还大幅提升了推理速度。GPT4o能够同时理解和处理文本、图像、音频等多种内容,展现了卓越的多模态能力。这一突破性进展将进一步推动自然语言处理和人工智能领域的发展,使人机交互更加高效和自然。OpenAI的最新发布标志着人工智能技术的又一里程碑,有望在更多实际应用中展现其强大功能。 评论: 多模态模型显著降低延迟,实现即时语音对话:GPT4o多模态能力大幅提升, 股票家数只 333 004 能够跨文本、音频和视频进行实时推理。使用语音模式与ChatGPT对话当中 总市值亿元 3372732 378 GPT35与GPT4平均延迟分别为28s、54s,而GPT4o对音频输入的响 流通市值亿元 2925433 417 应时间最短为232毫秒,平均为320毫秒,这与人类在对话中的响应时间相当。GPT4o运行速度大大提升,推动了更加自然的人机交互。 相对指数表现 视觉与音频理解能力提升,交互能力更上一层楼:GPT4o为用户提供更自然、 1M6M 12M 准确的交互体验。模型具有情感感知能力,能够生成不同情绪风格的语言交互, 绝对表现 61219 244 包括声情并茂的讲情感故事、实时视频对话、实时音频翻译等。此外,用户可 相对表现 24238 159 以随时打断模型,不需要等到其结束才能开始说话,更加符合人类交互逻辑。 API调用成本降低,凸显性价比优势:API的性价比显著提升。与GPT4Turbo相比,GPT4o的速度提升了两倍,成本则减少了50,并且速率限制提高了五倍。 GPT4o刷新SOTA,性能表现卓越:在传统基准测试中,GPT4o在文本、推理和编码智能方面,达到了GPT4Turbo级别的性能,同时在多语言、音频和视觉能力方面创下了新高。在文本评估中,GPT4o几乎碾压一众模型,包括 Claude3Opus,GeminiPro15,甚至是Llama3400B。GPT4o在零样本的COTMMLU(常识问题)上创造了887的新高分。与传统的5个样本,没有使用COT的MMLU评测中,GPT4o更是创下了872的新高分。 投资建议:AI大模型本质应落脚垂类应用,国内大模型正快速追赶美国先进水平,中文大模型的突破有望为下游AI应用注入新的活力,看好AI应用产品力与商业化落地进程。建议关注以下标的:AI应用侧:1)安全:永信至诚、深信服;2)办公:金山办公、福昕软件;3)法律:金桥信息、华宇软件、通 达海;4)医疗:润达医疗;5)教育:佳发教育、欧玛软件、新开普;6)金融:同花顺、新致软件;7)邮箱:彩讯股份;8)传媒:掌阅科技、华策影视;9)数据:海天瑞声;10)电商:焦点科技;11)OA:致远互联、泛微网络; 12)ERP:用友网络、金蝶国际。算力侧:1)算力基础:润泽科技、亚康股份、海光信息、寒武纪、龙芯中科;2)服务器:中科曙光、浪潮信息、紫光股份、神州数码、拓维信息。 风险提示:商业化后表现不及预期,用户付费意愿低,行业技术迭代速度较快。 目录 一、GPT4o交互能力实现突破,API成本更低4 (一)多模态模型显著降低延迟,实现即时语音对话4 (二)视觉与音频理解能力提升,交互能力更上一层楼4 (三)API调用成本降低,凸显性价比优势5 二、GPT4o刷新SOTA,性能表现卓越7 图表目录 图表1GPT4o与技术人员实时对话4 图表2GPT4o感知技术人员的情绪5 图表3GPT4o理解代码并简短描述5 图表4GPT4o的API性价比提升6 图表5GPT4o文本推理能力7 图表6GPT4o多语言识别表现8 图表7GPT4o音频翻译表现8 图表8GPT4oM3Exam基准测试9 图表9GPT4o视觉理解基准评估9 一、GPT4o交互能力实现突破,API成本更低 (一)多模态模型显著降低延迟,实现即时语音对话 GPT4o多模态能力大幅提升,能够跨文本、音频和视频进行实时推理。使用语音模式与ChatGPT对话当中,GPT35与GPT4平均延迟分别为28s、54s,而GPT4o对音频输入的响应时间最短为232毫秒,平均为320毫秒,这与人类在对话中的响应时间相当。GPT4o运行速度大大提升,推动了更加自然的人机交互。 图表1GPT4o与技术人员实时对话 资料来源:CG世界公众号 (二)视觉与音频理解能力提升,交互能力更上一层楼 GPT4o为用户提供更自然、准确的交互体验。模型具有情感感知能力,能够生成不同情绪风格的语言交互,包括声情并茂的讲情感故事、实时视频对话、实时音频翻译等。此外,用户可以随时打断模型,不需要等到其结束才能开始说话,更加符合人类交互逻辑。 图表2GPT4o感知技术人员的情绪 资料来源:CG世界公众号 图表3GPT4o理解代码并简短描述 资料来源:CG世界公众号 (三)API调用成本降低,凸显性价比优势 API的性价比显著提升。与GPT4Turbo相比,GPT4o的速度提升了两倍,成本则减少了50,并且速率限制提高了五倍。 图表4GPT4o的API性价比提升 资料来源:CG世界公众号 二、GPT4o刷新SOTA,性能表现卓越 在传统基准测试中,GPT4o在文本、推理和编码智能方面,达到了GPT4Turbo级别的性能,同时在多语言、音频和视觉能力方面创下了新高。在文本评估中,GPT4o几乎碾压一众模型,包括Claude3Opus,GeminiPro15,甚至是Llama3400B。GPT4o在零样本的COTMMLU(常识问题)上创造了887的新高分。与传统的5个样本,没有使用COT的MMLU评测中,GPT4o更是创下了872的新高分。 图表5GPT4o文本推理能力 资料来源:OpenAI官网 在音频ASR表现上,比起Whisperv3,GPT4o显著提高了所有语言的语音识别性能,尤其是对资源较少的语言。 图表6GPT4o多语言识别表现 资料来源:OpenAI官网 音频翻译能力,GPT4o刷新SOTA,并在MLS基准上超过了Whisperv3。 图表7GPT4o音频翻译表现 资料来源:OpenAI官网 OpenAI团队还对最新模型GPT4o在M3Exam基准上进行了测试。在所有语言的测试中,GPT4o都比GPT4强。 图表8GPT4oM3Exam基准测试 资料来源:OpenAI官网 在视觉理解基准EVALS评估上,GPT4o也取得了领先的性能。同样击败了GPT4Turbo、Gemini10Ultra、Gemini15Pro,以及Claude3Opus。 图表9GPT4o视觉理解基准评估 资料来源:OpenAI官网 计算机组团队介绍 首席研究员、组长:吴鸣远 上海交通大学硕士,曾任职于东方证券、兴业证券研究所,所在团队于20202022年连续三年获得新财富最佳分析师第三名,2023年加入华创证券研究所。 研究员:胡昕安 工学硕士,曾任职于海康威视,2023年加入华创证券研究所。助理研究员:梁佳 上海财经大学经济学硕士,2022年加入华创证券研究所。 助理研究员:张宇凡 香港大学会计学硕士。2023年加入华创证券研究所。助理研究员:周楚薇 香港中文大学经济学硕士。2024年加入华创证券研究所。 华创证券机构销售通讯录 地区 姓名 职务 办公电话 企业邮箱 北京机构销售部 张昱洁 副总经理、北京机构销售总监 01063214682 zhangyujiehcyjscom 张菲菲 北京机构副总监 01063214682 zhangfeifeihcyjscom 刘懿 副总监 01063214682 liuyihcyjscom 侯春钰 资深销售经理 01063214682 houchunyuhcyjscom 过云龙 高级销售经理 01063214682 guoyunlonghcyjscom 蔡依林 资深销售经理 01066500808 caiyilinhcyjscom 刘颖 资深销售经理 01066500821 liuying5hcyjscom 顾翎蓝 资深销售经理 01063214682 gulinglanhcyjscom 车一哲 销售经理 cheyizhehcyjscom 深圳机构销售部 张娟 副总经理、深圳机构销售总监 075582828570 zhangjuanhcyjscom 汪丽燕 高级销售经理 075583715428 wangliyanhcyjscom 张嘉慧 高级销售经理 075582756804 zhangjiahui1hcyjscom 王春丽 高级销售经理 075582871425 wangchunlihcyjscom 上海机构销售部 许彩霞 总经理助理、上海机构销售总监 02120572536 xucaixiahcyjscom 官逸超 上海机构销售副总监 02120572555 guanyichaohcyjscom 黄畅 上海机构销售副总监 021205722572552 huangchanghcyjscom 吴俊 资深销售经理 02120572506 wujun1hcyjscom 张佳妮 资深销售经理 02120572585 zhangjianihcyjscom 蒋瑜 高级销售经理 02120572509 jiangyuhcyjscom 施嘉玮 高级销售经理 02120572548 shijiaweihcyjscom 朱涨雨 高级销售经理 02120572573 zhuzhangyuhcyjscom 李凯月 高级销售经理 likaiyuehcyjscom 易星 销售经理 yixinghcyjscom 张玉恒 销售经理 zhangyuhenghcyjscom 广州机构销售部 段佳音 广州机构销售总监 075582756805 duanjiayinhcyjscom 周玮 销售经理 zhouweihcyjscom 王世韬 销售经理 wangshitao1hcyjscom 私募销售组 潘亚琪 总监 02120572559 panyaqihcyjscom 汪子阳 副总监 02120572559 wangziyanghcyjscom 江赛专 副总监 075582756805 jiangsaizhuanhcyjscom 汪戈 高级销售经理 02120572559 wanggehcyjscom 宋丹玙 销售经理 02125072549 songdanyuhcyjscom 华创行业公司投资评级体系 基准指数说明: A股市场基准为沪深300指数,香港市场基准为恒生指数,美国市场基准为标普500纳斯达克指数。公司投资评级说明: 强推:预期未来6个月内超越基准指数20以上; 推荐:预期未来6个月内超越基准指数1020; 中性:预期未来6个月内相对基准指数变动幅度在1010之间;回避:预期未来6个月内相对基准指数跌幅在1020之间。 行业投资评级说