您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国联证券]:Meta发布开源大模型Llama3.1,开源模型能力进一步提升 - 发现报告
当前位置:首页/行业研究/报告详情/

Meta发布开源大模型Llama3.1,开源模型能力进一步提升

信息技术2024-07-28黄楷、陈安宇国联证券曾***
Meta发布开源大模型Llama3.1,开源模型能力进一步提升

证券研究报告 行业研究|行业点评研究|计算机(2171) Meta发布开源大模型Llama3.1,开源模型能力进一步提升 请务必阅读报告末页的重要声明 2024年07月28日 证券研究报告 |报告要点 Meta发布开源大模型Llama3.1,此模型包含405B、70B、8B三个版本。该模型在多项基准测试中超越GPT-4o和Claude3.5Sonnet,开源模型的能力或已追赶上闭源SOTA模型。Meta外发的开源大模型Llama3.1最高版本参数量达到4050亿,该版本性能与最好的闭源模型性能接近。Llama3.1开源/免费使用权重和代码,并允许进行模型微调、蒸馏到其他模型以及在任何地点部署。模型提供128k上下文窗口,在多语言处理、优秀的代码生成、复杂问题理解推理能力上大幅提升,并包含模型工具使用。 |分析师及联系人 黄楷 陈安宇 SAC:S0590522090001SAC:S0590523080004 请务必阅读报告末页的重要声明1/4 行业研究|行业点评研究 2024年07月28日 计算机 Meta发布开源大模型Llama3.1,开源模型能力进一步提升 投资建议: 强于大市(维持) 上次建议:强于大市 相对大盘走势 计算机 10% 沪深300 -7% -23% -40% 2023/72023/112024/32024/7 相关报告 1、《计算机:重仓持股比例环比继续下降,信创持股市值增加》2024.07.23 2、《计算机:车路云一体化系列之三—V2X车载终端篇》2024.07.19 扫码查看更多 行业事件 Meta发布开源大模型Llama3.1,此模型包含405B、70B、8B三个版本。该模型在多项基准测试中超越GPT-4o和Claude3.5Sonnet,开源模型的能力或已追赶上闭源SOTA模型。 模型能力进一步提升,开源使用权重与代码 Meta外发的开源大模型Llama3.1最高版本参数量达到4050亿,该版本性能与最好的闭源模型性能接近。Llama3.1开源/免费使用权重和代码,并允许进行模型微调、蒸馏到其他模型以及在任何地点部署。模型提供128k上下文窗口,在多语言处理、优秀的代码生成、复杂问题理解推理能力上大幅提升,并包含模型工具使用。LlamaStackAPI可以轻松集成。整个生态系统包含25个合作伙伴,其中包括亚马逊、英伟达、Databricks、Groq、微软云和谷歌云。 强算力叠加Transformer架构,开发高质量开源模型 Meta在Llama3.1的报告中指出:数据、规模和复杂性管理是开发高质量模型的关键因素。数据上,改进了用于前训练和后训练的数据的数量和质量;规模上,模型在预训练时使用浮点运算规模几乎为最大版本Llama2的50倍,在15.6T文本上预训练了4050亿参数的模型;复杂性管理上,采用了Transformer架构并稍作调整,而不是MoE架构,在后训练中采用了监督微调(SFT)、拒绝采样(RS)和直接偏好优化(DPO)。模型405B版本使用16K个H100GPU训练,对应的服务器配备8个GPU和两个CPU,强算力平台叠加Transformer架构进一步提升模型质量。 投资建议 模型开源可以保护用户的数据,帮助用户微调/蒸馏适用于自己的模型,促使更多用户使用AI模型,从而长期推动AI生态体系进步。AI大模型产业的发展有望带动四方面投资机遇。(1)算力基础设施建设机遇:大模型能力提升或推动算力需求改变,国产GPU生态体系加速发展,建议关注中科曙光、紫光股份、浪潮信息等领军企业;(2)端侧AI软件开发机遇:端侧设备将是人机交互的重要中介,或将带动端侧AI应用的软件开发机遇,建议关注中科创达等相关公司;(3)生产力工具革新机遇:大模型有望为生产力工具带来降低专业门槛、减少重复劳动等变化,建议关注金山办公、用友网络、泛微网络等;(4)行业信息化创新机遇:受益于人机交互能力提升,大模型有望率先在政务、金融等领域窗口服务或培训场景落地,行业信息化厂商将是连接基础大模型厂商和行业客户的重要环节,建议关注恒生电子、宇信科技、中控技术、卫宁健康等行业信息化头部企业。 风险提示:客户转化程度不及预期;商业化进程不及预期风险;行业竞争加剧风险等。 1.风险提示 行业研究|行业点评研究 客户转化程度不及预期:由于传统搜索引擎存在多年,已在使用者中日常生活中形成固定行为模式,新型的AI搜索模式需要使用者一定时间适应。 商业化进程不及预期风险:AI搜索模式逐步推出,成熟的盈利商业模式仍未形成,商业化进程或有不及预期风险。 行业竞争加剧风险:AI搜索市场规模大,有取代传统搜索市场可能性,行业竞争或出现加剧。 行业研究|行业点评研究 分析师声明 本报告署名分析师在此声明:我们具有中国证券业协会授予的证券投资咨询执业资格或相当的专业胜任能力,本报告所表述的所有观点均准确地反映了我们对标的证券和发行人的个人看法。我们所得报酬的任何部分不曾与,不与,也将不会与本报告中的具体投资建议或观点有直接或间接联系。 评级说明 投资建议的评级标准 评级 说明 报告中投资建议所涉及的评级分为股票评级和行业评级(另有说明的除外)。评级标准为报告发布日后6到12个月内的相对市场表现,也即:以报告发布日后的6到12个月内的公司股价(或行业指数)相对同期相关证券市场代表性指数的涨跌幅作为基准。其中:A股市场以沪深300指数为基准,北交所市场以北证50指数为基准;香港市场以摩根士丹利中国指数为基准;美国市场以纳斯达克综合指数或标普500指数为基准;韩国市场以柯斯达克指数或韩国综合股价指数为基准。 股票评级 买入 相对同期相关证券市场代表性指数涨幅大于10% 增持 相对同期相关证券市场代表性指数涨幅在5%~10%之间 持有 相对同期相关证券市场代表性指数涨幅在-5%~5%之间 卖出 相对同期相关证券市场代表性指数涨幅小于-5% 行业评级 强于大市 相对表现优于同期相关证券市场代表性指数 中性 相对表现与同期相关证券市场代表性指数持平 弱于大市 相对表现弱于同期相关证券市场代表性指数 一般声明 除非另有规定,本报告中的所有材料版权均属国联证券股份有限公司(已获中国证监会许可的证券投资咨询业务资格)及其附属机构(以下统称“国联证券”)。未经国联证券事先书面授权,不得以任何方式修改、发送或者复制本报告及其所包含的材料、内容。所有本报告中使用的商标、服务标识及标记均为国联证券的商标、服务标识及标记。 本报告是机密的,仅供我们的客户使用,国联证券不因收件人收到本报告而视其为国联证券的客户。本报告中的信息均来源于我们认为可靠的已公开资料,但国联证券对这些信息的准确性及完整性不作任何保证。本报告中的信息、意见等均仅供客户参考,不构成所述证券买卖的出价或征价邀请或要约。该等信息、意见并未考虑到获取本报告人员的具体投资目的、财务状况以及特定需求,在任何时候均不构成对任何人的个人推荐。客户应当对本报告中的信息和意见进行独立评估,并应同时考量各自的投资目的、财务状况和特定需求,必要时就法律、商业、财务、税收等方面咨询专家的意见。对依据或者使用本报告所造成的一切后果,国联证券及/或其关联人员均不承担任何法律责任。 本报告所载的意见、评估及预测仅为本报告出具日的观点和判断。该等意见、评估及预测无需通知即可随时更改。过往的表现亦不应作为日后表现的预示和担保。在不同时期,国联证券可能会发出与本报告所载意见、评估及预测不一致的研究报告。 国联证券的销售人员、交易人员以及其他专业人士可能会依据不同假设和标准、采用不同的分析方法而口头或书面发表与本报告意见及建议不一致的市场评论和/或交易观点。国联证券没有将此意见及建议向报告所有接收者进行更新的义务。国联证券的资产管理部门、自营部门以及其他投资业务部门可能独立做出与本报告中的意见或建议不一致的投资决策。 特别声明 在法律许可的情况下,国联证券可能会持有本报告中提及公司所发行的证券并进行交易,也可能为这些公司提供或争取提供投资银行、财务顾问和金融产品等各种金融服务。因此,投资者应当考虑到国联证券及/或其相关人员可能存在影响本报告观点客观性的潜在利益冲突,投资者请勿将本报告视为投资或其他决定的唯一参考依据。 版权声明 未经国联证券事先书面许可,任何机构或个人不得以任何形式翻版、复制、转载、刊登和引用。否则由此造成的一切不良后果及法律责任由私自翻版、复制、转载、刊登和引用者承担。 联系我们 北京:北京市东城区安外大街208号玖安广场A座4层上海:上海市虹口区杨树浦路188号星立方大厦8层 无锡:江苏省无锡市金融一街8号国联金融大厦16楼深圳:广东省深圳市福田区益田路4068号卓越时代广场1期13楼