您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[平安证券]:行业点评:Anthropic推出Claude3,能力对标GPT-4 - 发现报告
当前位置:首页/行业研究/报告详情/

行业点评:Anthropic推出Claude3,能力对标GPT-4

信息技术2024-03-05闫磊、付强、黄韦涵平安证券�***
行业点评:Anthropic推出Claude3,能力对标GPT-4

行业点评 Anthropic推出Claude3,能力对标GPT-4 计算机 2024年03月05日 行情走势图 强于大市(维持) 相关研究报告 【平安证券】行业点评*计算机*OpenAI发布文生视频大模型Sora,在全球视频大模型领域取得里程碑式进展*强于大市20240218 证券分析师 闫磊 投资咨询资格编号 S1060517070006 付强 YANLEI511@pingan.com.cn投资咨询资格编号S1060520070001 黄韦涵 FUQIANG021@pingan.com.cn投资咨询资格编号S1060523070003 HUANGWEIHAN235@pingan.com.cn 事项: 当地时间3月4日,Anthropic推出Claude3系列大模型,包括Claude3Haiku、Claude3Sonnet和Claude3Opus三个版本。 平安观点: Anthropic推出Claude3系列大模型,能力对标GPT-4。当地时间3月4日,Anthropic推出Claude3系列大模型,包括Claude3Haiku、Claude3Sonnet和Claude3Opus三个版本(按能力升序排列),用户可以根据具体应用情况平衡智能水平、响应速度与成本,选择合适的版本。Opus作为Claude3系列智能程度最高的模型,其在多项人工智能系统常用评估基准方面均优于OpenAI的GPT-4。具体而言:根据Anthropic官网数据,在本科生级别知识(MMLU)、研究生级别推理(GPQA)、基础数学(GSM8K)、数学问题求解(MATH)、多语言数学(MGSM)、代码能力(HumanEval)、文本推理(DROP,F1score)、综合评价 (BBH))、知识问答(ARC-challenge)、常识(HellaSwag)等方面,Claude3OpusvsGPT-4的评估结果分别为86.8%vs86.4%、50.4%vs35.7%、95.0%vs92.0%、60.1%vs52.9%、90.7%vs 74.5%、84.9%vs67.0%、83.1vs80.9、86.8%vs83.1%、96.4%vs 96.3%、95.4%vs95.3%。此外,Opus在复杂任务方面表现出接近人类水平的理解力和流畅性。 Claude3在响应速度、视觉能力、上下文理解能力、输出准确度、长文本能力等方面表现出色。1)响应速度:Haiku目前是市场上响应速度最快、性价比最高的模型,它可以在三秒内阅读完一篇arXiv上的包含图表且信息和数据量巨大的论文(约10000token)。Anthropic预计,Haiku推出后,其性能将进一步提升。2)视觉能力:Claude3作为多模态大模型,具有强大的视觉能力,Claude3可以处理包括照片、图表、图形和技术图表在内的多种视觉格式,在其部分客户知识库中,有50%的信息是以PDF、流程图及幻灯片等格式存储的。3)上下文理解能力:Claude3在上下文理解方面取得明显改善,相比前几代模型,Claude3对请求的理解更加精准,在面对可能触及系统边界的询问时,拒绝回答的可能性明显降低。4)输出准确度:与Claude2.1相比,Opus在回答具有挑战性的开放式问题时的准确性实现了翻倍。此外,公司将在Claude3中启用引文功能,使其可以直接引用参考资料中的原文来支撑其输出的答案。5)长文本能力:Claude3将在发布时提供200K上下文窗口。Claude3三个版本均可接受100万tokens的输入,该能力将面向有需求的客户定向开放。 行 业报 告 行 业 点评 证 券研究报 告 Claude3定价体系公布,Sonnet和Haiku版本相比GPT-4具有价格优势 计算机行业点评 。Claude3的三款产品基于其性能,对标不同类型的市场进行了差异化定价。Opus是Claude3系列中智能水平最高的版本,每100万tokens输入/输出收费分别为15美元/57美元,主要应用于跨API和数据库规划及执行复杂操作、药物发现、以及市场趋势的分析预测等场景;Sonnet在智能程度和响应速度之间进行了平衡,每100万tokens输入/输出收费分别为3美元/15美元,主要用于RAG,产品推荐、定向营销,以及代码生成、质量控制、从图像中解析文本等场景;Haiku是Claude3系列中响应速度最快的版本,每100万tokens输入/输出收费分别为0.25美元/1.25美元,主要应用于实时互动及翻译、在内容审核时捕捉危险行为或客户请求、以及优化物流、库存管理等场景。对比GPT-4Turbo每百万tokens输入/输出费用10美元/30美元,虽然Opus的价格高于GPT-4Turbo,但是Sonnet及Haiku相比GPT-4具有价格优势。Opus和Sonnet目前已可以在claude.ai和ClaudeAPI中使用,ClaudeAPI已在159个国家和地区普遍可用;Haiku即将推出。随着Claude3全系列商业化步伐的推进,其有望凭借出色的模型能力以及差异化的定价体系在大模型领域的激烈角逐中赢得一席之地。 投资建议:近期,海外大模型持续迭代。OpenAI的文生视频大模型Sora、谷歌的Gmini1.5及基础世界模型Genie、Anthropic的Claude3等均在近期陆续发布。同时,科大讯飞、百度等国产大模型领军企业也在对标国际主流大模型持续追赶。当前,全球范围内大模型领域的竞争依然白热化,这将持续拔升大模型的整体能力水平,提升大模型的多模态能力。大模型需要大算力,大模型算法的迭代升级将为全球和中国AI算力市场的增长提供强劲动力。在美国对华半导体出口管制升级的背景下,我国国产AI芯片产业链将加快成熟,相关AI芯片和服务器厂商将深度受益。另外,在应用端,我国国产大模型能力持续升级,AIGC产业未来发展前景广阔。在标的方面:1)算力方面,推荐浪潮信息、中科曙光、紫光股份、神州数码、海光信息、龙芯中科,建议关注工业富联、寒武纪、景嘉微、高新发展、拓维信息、软通动力;2)算法方面,推荐科大讯飞;3)应用场景方面,强烈推荐中科创达、恒生电子、盛视科技,推荐金山办公,建议关注万兴科技、同花顺、彩讯股份;4)网络安全方面,强烈推荐启明星辰。 风险提示:1)国内大模型算法发展可能不及预期。2)AI算力供应链风险上升。3)大模型产品的应用落地低于预期。 平安证券研究所投资评级: 股票投资评级: 强烈推荐(预计6个月内,股价表现强于市场表现20%以上)推荐(预计6个月内,股价表现强于市场表现10%至20%之间)中性(预计6个月内,股价表现相对市场表现在±10%之间)回避(预计6个月内,股价表现弱于市场表现10%以上) 行业投资评级: 强于大市(预计6个月内,行业指数表现强于市场表现5%以上)中性(预计6个月内,行业指数表现相对市场表现在±5%之间)弱于大市(预计6个月内,行业指数表现弱于市场表现5%以上) 公司声明及风险提示: 负责撰写此报告的分析师(一人或多人)就本研究报告确认:本人具有中国证券业协会授予的证券投资咨询执业资格。 平安证券股份有限公司具备证券投资咨询业务资格。本公司研究报告是针对与公司签署服务协议的签约客户的专属研究产品,为该类客户进行投资决策时提供辅助和参考,双方对权利与义务均有严格约定。本公司研究报告仅提供给上述特定客户,并不面向公众发布。未经书面授权刊载或者转发的,本公司将采取维权措施追究其侵权责任。 证券市场是一个风险无时不在的市场。您在进行证券交易时存在赢利的可能,也存在亏损的风险。请您务必对此有清醒的认识,认真考虑是否进行证券交易。 市场有风险,投资需谨慎。 免责条款: 此报告旨为发给平安证券股份有限公司(以下简称“平安证券”)的特定客户及其他专业人士。未经平安证券事先书面明文批准,不得更改或以任何方式传送、复印或派发此报告的材料、内容及其复印本予任何其他人。 此报告所载资料的来源及观点的出处皆被平安证券认为可靠,但平安证券不能担保其准确性或完整性,报告中的信息或所表达观点不构成所述证券买卖的出价或询价,报告内容仅供参考。平安证券不对因使用此报告的材料而引致的损失而负上任何责任,除非法律法规有明确规定。客户并不能仅依靠此报告而取代行使独立判断。 平安证券可发出其它与本报告所载资料不一致及有不同结论的报告。本报告及该等报告反映编写分析员的不同设想、见解及分析方法。报告所载资料、意见及推测仅反映分析员于发出此报告日期当日的判断,可随时更改。此报告所指的证券价格、价值及收入可跌可升。为免生疑问,此报告所载观点并不代表平安证券的立场。 平安证券在法律许可的情况下可能参与此报告所提及的发行商的投资银行业务或投资其发行的证券。平安证券股份有限公司2024版权所有。保留一切权利。 平安证券研究所电话:4008866338 深圳上海北京 深圳市福田区益田路5023号平安金融中心B座25层 上海市陆家嘴环路1333号平安金融大厦26楼 北京市丰台区金泽西路4号院1号楼丽泽平安金融中心B座25层