行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

计算机行业动态跟踪：Claude 3.5 Sonnet性能全面升级，模型厂商竞争进入新阶段

信息技术 2024-06-23 浦俊懿,陈超东方证券李艺华🌸

计算机行业动态跟踪 —— Claude 3.5 Sonnet性能全面升级，模型厂商竞争进入新阶段

概览： Anthropic于6月21日发布了Claude3.5系列的第一款产品——Claude 3.5 Sonnet。这款新产品在性能上全面超越了前代产品Claude 3 Opus，并在多个模型指标中超过了GPT-4o。Claude 3.5 Sonnet在运行速度方面比Claude 3 Opus快两倍，成本仅为其五分之一，且定价相同，为每百万输入token收费$3，每百万输出token收费$15，同时具有200K令牌上下文窗口。

性能升级：

Claude 3.5 Sonnet在基准测试中表现出色，多项指标超过GPT-4o，特别是在研究生水平推理（GPQA）、本科生知识（MMLU）、编码能力（HumanEval）等领域设立了新的行业基准。
在捕捉细微差异、展现幽默感和执行复杂指令方面，Claude 3 Sonnet实现了显著提升，能输出流畅、自然且富有亲和力的高质量内容，被认为是目前最具人性化且性能最强的AI模型。
在内部编码评估中，Claude 3.5 Sonnet展示了令人印象深刻的解决问题能力，解决率达到了64%，相比过去的产品Claude 3 Opus提升了26%。

多模态能力： Claude 3.5 Sonnet也是目前最强大的视觉模型，其视觉能力在各项评估中均表现出色，仅在一项多模态任务中略逊于GPT-4o，但在视觉数学推理、科学图解、图表问答和文档可视化问答等方面均超越了其他模型。其在视觉任务上的能力尤其出色，能够帮助用户从瑕疵图像中提取文本，提供图形、图像和插图方面的更多见解。

新增功能： Claude推出了名为Artifacts的新功能，这是一种用户与Claude交互的方式，为用户提供了一个可视化的专用窗口。用户可以通过描述要求Claude生成代码、网页设计等内容，Claude会提供一个动态工作区，让用户实时查看、编辑并完成Claude创作的内容。这标志着Claude从简单的对话式AI转变为一个协作式的工作环境，未来将为团队和组织提供安全的共享中心来整合知识、文档和工作内容。

市场影响：随着Claude 3.5 Sonnet的发布，预计会加速AI相关应用的落地，同时对算力的需求也将大幅增加。分析师推荐关注中科创达、虹软科技、金山办公、泛微网络、新致软件、彩讯股份、科大讯飞、万兴科技等公司在AI应用领域的投资机会；在AI算力方面，建议关注云赛智联、中科曙光、海光信息、寒武纪-U、润泽科技、华铁应急等公司在算力基础设施方面的投资机会；此外，还推荐了星环科技-U在其他工具领域的投资。

风险提示：技术落地不及预期的风险和政策监管风险。技术进步的速度可能影响AI应用的商业化进程，而关于AI创作内容的版权及监管政策的不确定性也可能影响其应用的推广。

投资建议：在Claude 3.5 Sonnet的推动下，AI领域的创新步伐加快，投资机会增多。建议投资者关注AI应用与算力领域的企业，同时警惕技术发展与政策监管带来的风险。

分析师声明：分析师在撰写本报告时，其观点准确反映了对证券或发行人的真实看法，与薪酬无关。报告中提及的证券评级仅供参考，不代表投资建议，投资者应考虑自身情况谨慎决策。

核心观点 ⚫6月21日，Anthropic发布了Claude3.5系列第一款产品Claude 3.5 Sonnet。Claude 3.5 Sonnet在性能方面对比Claude 3 Opus全面升级，并在多个模型指标中超越GPT-4o。Claude 3.5 Sonnet在运行速度方面是Claude 3 Opus的两倍，成本仅为其五分之一，且定价与之相同皆为每百万输入token收费$3，每百万输出token收费$15，并具有200K令牌上下文窗口。 ⚫Claude 3.5 Sonnet在基准测试中表现优异，多方面力压GPT-4o。Claude 3.5Sonnet在性能上对比Claude 3系列有巨大提升，并为研究生水平推理（GPQA）、本科生水平知识（MMLU）、编码能力（HumanEval）等设定了全新的行业基准。Claude 3 Sonnet在捕捉微妙差异、展现幽默以及执行复杂指令方面获得显著提升，可输出流畅自然且亲切的高质量内容，为目前最具人性且最强性能的AI模型。同时，Claude 3.5 Sonnet在内部编码评估中展示惊人能力，可解决64%的问题，对比过去产品Claude 3 Opus可解决38%问题有较大提升。浦俊懿021-63325888*6106pujunyi@orientsec.com.cn 执业证书编号：S0860514050004陈超021-63325888*3144chenchao3@orientsec.com.cn执业证书编号：S0860521050002 ⚫Claude 3.5 Sonnet为目前最强大的视觉模型。Claude 3.5 Sonnet在视觉能力各方面表现最为优异，在多模态任务评估中仅一项略逊于GPT-4o，其余各项如视觉数学推理、科学图解、图表问答和文档可视化问答皆力压其他模型。其视觉推理任务能力表现最为优异，如解释图表等，可帮助使用者从一个具有瑕疵的图像中转录文本，也可从图形、图像和插图等方面为使用者提供更多见解内容。覃俊宁qinjunning@orientsec.com.cn宋鑫宇songxinyu@orientsec.com.cn ⚫Claude 3.5 Sonnet推出全新功能Artifacts。Artifacts拓展功能是用户与Caude的一种互动交互方式，该功能为用户提供一个可视化专用窗口。当用户要求Claude3.5 Sonnet生成代码、网页设计等方面时，其会为用户提供动态工作区，用户可以实时查看、编辑并完成Claude创作内容。Claude的这一预览功能象征着它从单纯的对话式人工智能跃升为一个协作式的工作环境，未来将为团队、组织赋能，为其提供安全的共享中心以整合他们的知识、文档与工作内容。投资建议与投资标的我们认为，Anthropic推出Claude 3.5 Sonnet有望加速AI相关应用落地，同时对于算力的需求也会随之大幅提升。 ⚫AI应用：建议关注中科创达(300496，买入)、虹软科技(688088，未评级)、金山办公(688111，增持)、泛微网络(603039，买入)、新致软件(688590，未评级)、彩讯股份(300634，买入)、科大讯飞(002230，买入)、万兴科技(300624，未评级)等公司 ⚫AI算力：建议关注云赛智联(600602，未评级)、中科曙光(603019，买入)、海光信息(688041，买入)、寒武纪-U(688256，未评级)、润泽科技(300442，未评级)、华铁应急(603300，买入)等公司 ⚫其他工具：星环科技-U(688031，未评级) 风险提示技术落地不及预期；政策监管风险目录 Anthropic发布Claude 3.5Sonnet，性能全面升级........................................4 OpenAI模型进展放缓，Anthropic加大工具投入............................................6 投资建议与投资标的......................................................................................7 风险提示........................................................................................................7 图表目录图1：Anthropic发布Claude 3.5 Sonnet.....................................................................................4图2：Claude 3.5 Sonnet性能全面升级.......................................................................................4图3：Claude 3.5 Sonnet在基准测试中表现优异.........................................................................4图4：Claude 3.5 Sonnet多模态能力达到SOTA.........................................................................4图5：Claude看图直接生成json文件..........................................................................................5图6：Claude可以生成PPT.........................................................................................................5图7：通过描述创建SVG格式游戏角色并用Artifacts预览..........................................................6图8：通过描述把游戏角色放进网页场景中并预览.......................................................................6 Anthropic发布Claude3.5Sonnet，性能全面升级 6月21日，Anthropic发布了Claude3.5系列第一款产品Claude 3.5 Sonnet。Claude 3.5Sonnet在性能方面对比Claude 3 Opus全面升级，并在多个模型指标中超越GPT-4o。Claude3.5 Sonnet在运行速度方面是Claude 3 Opus的两倍，成本仅为其五分之一，且定价与之相同皆为每百万输入token收费$3，每百万输出token收费$15，并具有200K令牌上下文窗口。用户现在可以在Claude.ai和Claude iOS应用程序上免费体验，如果订阅了Claude Pro和团队计划，则可以享受更高的速率；此外，还可以通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI使用。 Claude 3.5 Sonnet在基准测试中表现优异，多方面力压GPT-4o。Claude 3.5 Sonnet在性能上对比Claude3系列有巨大提升，并为研究生水平推理（GPQA）、本科生水平知识（MMLU）、编码能力（HumanEval）等设定了全新的行业基准，AI往往在幽默感层面表现较差，而Claude 3Sonnet在捕捉微妙差异、展现幽默以及执行复杂指令方面获得显著提升，可输出流畅自然且亲切的高质量内容，为目前最具人性且最强性能的AI模型。值得注意的是，Claude3.5Sonnet在内部编码评估中展示惊人能力，可解决64%的问题，对比过去产品Claude3Opus可解决38%问题有较大提升。图3：Claude 3.5 Sonnet在基准测试中表现优异图4：Claude 3.5 Sonnet多模态能力达到SOTA Claude3.5 Sonnet也是目前最强大的视觉模型。Claude 3.5 Sonnet在视觉能力各方面表现最为优异，在多模态任务评估中仅一项略逊于GPT-4o，其余各项如视觉数学推理、科学图解、图表问答和文档可视化问答皆力压其他模型。其视觉推理任务能力表现最为优异，如解释图表等，可帮助使用者从一个具有瑕疵的图像中转录文本，也可从图形、图像和插图等方面为使用者提供更多见解内容。 Claude 3.5 Sonnet推出全新功能Artifacts。Artifacts拓展功能是用户与Caude的一种互动交互方式，该功能为用户提供一个可视化专用窗口。当用户要求Claude 3.5 Sonnet生成代码、网页设计等方面时，其会为用户提供动态工作区，用户可以实时查看、编辑并完成Claude创作内容。这个功能的添加，大大增强了Claude在复杂项目中的可用性。用户可以参考软件开发的流程，将需求分解为多个步骤，更方便Claude Sonnet进行「渐进式开发」和迭代。Claude的这一预览功能象征着它从单纯的对话式人工智能跃升为一个协作式的工作环境，未来将为团队、组织赋能，为其提供安全的共享中心以整合他们的知识、文档与工作内容。有关分析师的申明，见本报告最后部分。其他重要信息披露见分析师申明之后部分，或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。数据来源：Anthropic，新智元，东方证券研究所 OpenAI模型进展放缓，Anthropic加大工具投入 OpenAI模型进展速度放缓，模型能力难以实现大跨越。OpenAI的GPT-4发布已经过去一年多，至今仍未发布全新一代的升级模型，GPT-4o和谷歌的Gemini1.5Pro相比于GPT-4的都只是小幅提升。由于当前模型架构的固化以及训练所需的巨大计算量，在没有重大研究突破的情况下，很难再次看到从GPT-3到GPT-4那样的飞跃。模型之间能力差距逐步缩小，Anthropic发力生态系统构建。我们能够看到，近期各家厂商推出的旗舰级模型，互相之间的能力差距都非常小，从可用性上讲比较难以体现出较大差别。但OpenAI以其强大的知名度和微软背书，其客户数和收入都远远领先于其他的大模型竞品。据TheInformation报道，OpenAI在从23年12月开始的过去六个月里年化收入达到34亿美元，其中大部分收入来自OpenAI的订阅和API访问（32亿美元）。而Anthropic到2024年底的预计收入不到10亿美元。因此，Anthropic围绕着Claude加大了生态系统构建，从工具层面提高了投入，如实验性的引导AI，允许开发者「引导」模型的内部特性；集成使其模型能够在应用程序中执行操作；发布基于模型构建的工具，比如最新的Artifacts等。我们认为，随着生成式AI与大模型的竞争进入新阶段，大模型厂商不仅需要继续拓展大模型的能力边界，如何从生态、工具等角度出发，培养用户心智与喜好，获取更多的回报会成为下一阶段的竞争重点。投资建议与投资标的我们认为，Anthropic推出Claude3.5Sonnet有望加速AI相关应用落地，同时对于算力的需求也会随之大幅提升。 ⚫AI应用：建议关注中科创达(300496，买入)、虹软科技(688088，未评级)、金山办公(688111，增持)、泛微网络(603039，买入)、新致软件(688590，未评级)、彩讯股份(300634，买

点击免费查看完整报告

计算机行业动态跟踪：Claude 3.5 Sonnet性能全面升级，模型厂商竞争进入新阶段

你可能感兴趣

计算机行业先进科技主题周报-周观点：苹果全面拥抱AI，Anthropic发布旗舰大模型Claude 3.5 Sonnet

计算机行业周报：全球首个混合推理模型Claude 3.7 Sonnet发布，高情商模型GPT-4.5问世

计算机行业动态跟踪：腾讯发布战略产品“智能云”：互联网正式全面进入“技术驱动”的下半场

计算机行业动态跟踪：科技部发布人工智能开放创新平台名单，AI规划进入全面启动实施阶段

计算机行业点评报告：Llama3性能升级，AI应用和算力厂商持续受益

股权激励、员工持股点评暨系列报告28：治理全面升级优化，进入高速发展新阶段

房地产行业动态跟踪：首都总体规划获批，大北京发展进入新阶段！

非银行金融行业跟踪：全面注册制落地提速，资本市场改革进入新阶段

计算机行业跟踪报告：DeepSeek-V4模型预览版正式上线并同步开源，海内外大模型厂商纷纷提质降价

计算机行业月报：AI模型成果密集发布，制裁或将全面升级