您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中泰证券]:人工智能行业双周报:宁夏印发促进AI发展相关政策,Meta开源代码生成模型Code Llama - 发现报告
当前位置:首页/行业研究/报告详情/

人工智能行业双周报:宁夏印发促进AI发展相关政策,Meta开源代码生成模型Code Llama

AI智能总结
查看更多
人工智能行业双周报:宁夏印发促进AI发展相关政策,Meta开源代码生成模型Code Llama

宁夏回族自治区人民政府办公厅印发了《促进人工智能创新发展政策措施》。自2023年9月15日起施行,有效期至2025年12月31日。文件中提到加强智算资源统筹供给,加快建设一批与制造、生物医药、新材料等领域紧密结合的超算、智算中心; 制定自治区大模型训练数据需求清单和供给目录,建立数据供需对接机制;鼓励模型创新,支持落地企业开展大模型训练等方面。 Meta发布开源代码大模型CodeLlama。Code Llama是基于Meta的开源大语言模型Llama 2之上开发而成,提供基础代码、专门针对Python开发和基于自然语言指令微调的,70亿、130亿、340亿三种参数模型。允许企业、个人开发者使用此模型,进行商业化。 投资建议:人工智能新一轮十年级的技术和产业革命大幕已经拉开,短期调整并不影响产业的长期投资机会,当前海外已经开始进入商业落地阶段,ChatGPT、Midjourney等现象级爆品出现,微软、Adobe、Salesforce、Zoom等软件巨头亦纷纷推出商业化产品,静待数据的持续验证;国内短期看算力最确定,模型训练拉动训练算力需求,未来应用大规模兴起亦会拉动推理算力需求,大模型仍处于群雄逐鹿、快速迭代阶段,未来空间大且会格局收敛,应用端长期空间最大,厂商百花齐放。 算力:服务器建议关注浪潮信息、中科曙光、紫光股份等,芯片建议关注英伟达、寒武纪、海光信息、龙芯中科等; 模型:国内建议关注科大讯飞、百度、商汤、三六零、格灵深瞳、云从科技、云天励飞等;海外建议关注微软、Meta、谷歌、特斯拉等; 生态链:数据建议关注星环科技、海天瑞声等,安全建议关注深信服、启明星辰、安恒信息、天融信、绿盟科技、迪普科技、安博通、奇安信、永信至诚、美亚柏科等; 应用:生产力工具建议关注金山办公、万兴科技、广联达、中望软件、彩讯股份、福昕软件等;ERP等办公场景建议关注金蝶国际、明源云、鼎捷软件、用友网络、致远互联等;金融场景建议关注恒生电子、同花顺、中科软、宇信科技等;汽车场景建议关注中科创达、德赛西威、经纬恒润、万集科技等;医疗场景建议关注卫宁健康、创业慧康、嘉和美康、医渡科技、鹰瞳科技等;其他建议关注焦点科技、中科星图、航天宏图、拓尔思、佳发教育、神思电子等。 风险提示:AI技术落地不及预期、产品市场竞争加剧、数据更新不及时等 重点标的公司跟踪 市场整体涨跌幅情况 近两周涨跌幅情况:【上证综指】涨跌幅-3.92%;【沪深300】涨跌幅-4.51%; 【深证成指】涨跌幅-6.28%;【创业板指】涨跌幅-6.70%;【计算机(申万)】涨跌幅-8.28%。 年初至今涨跌幅情况:【上证综指】涨跌幅-0.82%;【沪深300】涨跌幅-4.20%; 【深证成指】涨跌幅-8.04%;【创业板指】涨跌幅-13.05%;【计算机(申万)】涨跌幅10.74%。 图表1:市场涨跌幅情况 人工智能重点关注公司涨跌幅情况 图表2:重点关注人工智能股票池涨跌幅情况 政策与前沿进展 宁夏:印发《促进人工智能创新发展政策措施》 宁夏回族自治区人民政府办公厅印发了《促进人工智能创新发展政策措施》,自2023年9月15日起施行,有效期至2025年12月31日。文件中提到的主要方面有: 加强智算资源统筹供给,包括做大智算规模、推动数据开放、做大数据供给、构建算力网络、优化算力调度、支持自主可控等方面。将加快建设一批与制造、生物医药、新材料等领域紧密结合的超算、智算中心,对于当年固定资产投资达到3亿元以上的招商引资项目,一次性给予固定资产投资额1‰、单个项目最高不超过500万元的奖励。 在推动数据开放方面,制定自治区大模型训练数据需求清单和供给目录,建立数据供需对接机制。推动公共数据、社会数据定向有条件向企业开放,向社会推出一批可信高质量的数据集、语料库和通用模型。鼓励金融、保险等具备行业大数据供给、开发、治理能力的头部企业落户宁夏,给予不超过实际投入的10%、最高200万元资金支持。 鼓励模型创新。支持落地企业开展大模型训练。对于参数量超过百亿、典型应用场景超过5个的大模型,给予最高1000万元资金支持。加大平台开放。支持企业、科研院所建设开源开放、协同共享的人工智能数据归集、算法汇聚、算力开放及检验检测的创新服务平台,并择优给予综合贡献度较高的开放平台最高500万元资金奖励。鼓励数智应用。每年总计发放不超过4000万元“算力券”,用于支持高校、科研机构、算力中介服务机构、科技型中小微企业和创客等使用区内超算、智算资源,开展核心算法创新、模型训练研发等。 在完善要素资源保障机制方面,强调将建立健全公开透明的人工智能监管体系,依法依规、包容审慎开展监管。积极利用国家开发性、政策性金融机构资金和自治区财政相关专项资金,支持超算、智算、人工智能等领域关键技术攻关、应用示范和平台建设。组建规模不低于100亿元的数字经济产业基金。鼓励社会资本投入超算、智算、人工智能等相关产业,在基金投入、债券发行、股权融资等方面为产业发展提供资本支持。引导金融机构在银行信贷等方面为产业发展提供资金支持。 新闻链接: AI领域投融资事件跟踪 AI教育公司SizzleAI获千万美元A轮融资 美国人工智能教育公司Sizzle AI于近日获得750万美元种子轮资金。 本轮融资由Owl Ventures领投,8VC跟投。Sizzle AI计划将这笔资金用于发展业务,扩大业务覆盖范围。 Sizzle AI由连续创业者Jerome Pesenti创办,目前其担任首席执行官。 创立Sizzle AI之前,Jerome Pesenti曾在Meta担任人工智能 副总裁,专注于通过人工智能增强产品安全性和价值。如今,他继续从事人工智能领域,通过推出免费的学习应用Sizzle,鼓励学生进行互动学习,从而解决问题,培养思辨能力。 通过Sizzle,初高中生和想要提升技能的学习者可以自由提问数学、物理、化学和生物等学科的有关问题,Sizzle会一步步引导学生解决问题,而不只是提供一个最终的答案。在这个过程中,Sizzle会使用积极和肯定的话语,帮助学生建立对学习的信心和热情。与向真人提问相比,学生在App里更放得开,不用犹豫,也无需担心因为失败而被别人评价。 新闻链接: AI工业检测公司频率探索获千万元A轮融资 8月22日,频率探索智能科技江苏有限公司(以下简称“频率探索”)完成数千万元A轮融资,本轮由涌铧投资领投,常州高新投跟投,融资资金将主要用于产品研发、生产线建设与市场拓展。 频率探索成立于2021年1月,位于常州新北区,是一家工业AI预测性维护公司。公司掌握了大量的工业设备机理研究数据及信号分析诊断方法,能够为设备故障提供早期诊断、故障量化、寿命预测及智能运维服务。频率探索解决方案是一套硬件、算法、软件结合的解决方案。目前,频率探索可以诊断20多个行业、50多种设备的40多种故障类型。 新闻链接:https://36kr.com/p/2381782025153799 AI生成视频初创公司Irreverent Labs完成新一轮融资 AI生成视频初创公司Irreverent Labs完成了新一轮融资,由Samsung Next领投,但Irrerent没有透露具体融资金额。根据Irreverent Labs的联合创始人兼首席执行官Rahul Sood的说法,该公司选择与三星作为战略投资者更紧密地合作,部分原因是为了接触可能希望使用其API的Samsung Next。此外,该公司将与三星的设备部门合作,以制定更大规模的分销策略。 该公司成立于2021年,而该轮融资也并不是Irreverent Labs的第一轮融资。 公司去年筹集了45万美元的资金,由Andreessen Horowitz(a16z)领投。 当时 ,Irreverent被媒体描述为一家区块链公司 , 开发了一款名为MechaFightClub的机器人斗鸡游戏,用户在游戏中使用NFT。该公司现在坚持认为,这款游戏的本质是一个大型机器学习模型,就Irreverant Labs而言,它将允许用户在今年年末使用各种输入方式制作视频,包括图像、文本、音频。 新闻链接:https://36kr.com/p/2403337639371526 海内外AI公司新品追踪 科大讯飞:星火大模型V2.0发布,代码能力接近ChatGPT 8月15日,科大讯飞如期发布“讯飞星火认知大模型V2.0版本”(简称:星火V2.0),迎来代码能力和多模态能力的大幅提升。前者是支撑认知大模型智慧的关键维度,后者可以生成多种不同形式的数据,例如图像、语音、文本等,以及它们之间的组合和交互,从而扩展模型的应用场景,提高数据的多样性和丰富性。 从业界参考测试集上的效果对比来看,星火V2.0基于Python和C++两种编程语言行代码写作能力已高度逼近ChatGPT,差距仅为1%和2%。同时,他明确了星火大模型远期目标:到10月24日,星火大模型代码能力全面超越ChatGPT,明年上半年将正式对标GPT4。 新闻链接: Meta:开源文本生成代码模型CodeLlama 8月25日,Meta在官网正式开源了,文本生成代码模型Code Llama。Code Llama是基于Meta前不久发布的,最强开源大语言模型Llama 2之上开发而成,提供基础代码、专门针对Python开发和基于自然语言指令微调的,70亿、130亿、340亿三种参数模型。允许企业、个人开发者使用此模型,进行商业化。 Meta表示,Code Llama在代码任务上的表现,优于目前所有开源代码模型。Code Llama支持Python、C++、Java、PHP、Typescript (Javascript)、C#和Bash等主流编程语言,可根据自然文本或代码直接生成代码。 Code Llama模型提供了高达100,000个上下文标记的稳定生成。所有模型均在16,000个标记的序列上进行训练,并在最多100,000个标记的输入上显示出改进。这意味着,开发人员在进行大型代码模型测试、调优时,可以将其全部输入到Code Llama中进行测试。 图表3:CodeLlama界面 Code Llama提供70亿、130亿和340亿三种参数模型,每个模型都使用了5000亿tokens代码数据训练而成。基础模型和指令模型经过了中间填充文本(FIM)功能的训练,允许将代码插入到现有代码中,这意味着它们可以支持开箱即用的代码完成任务。资源消耗方面,70亿参数模型可在单个GPU上运行。340亿参数模型可返回最佳结果并提供更好的编程辅助,但资源消耗更大。 图表4:Llama版本情况 为了针对现有解决方案测试Code Llama的性能,Meta使用了两个流行的编码基准:HumanEval和Mostly Basic Python编程(MBPP)。 HumanEval测试模型根据文档字符串完成代码的能力,MBPP测试模型根据描述编写代码的能力。 测试结果显示,Code Llama的表现优于开源、特定代码的Llama,并且优于Llama 2。例如,Code Llama 340亿参数模型在HumanEval上得分为53.7%,在MBPP上得分为56.2%,与ChatGPT性能相当。 图表5:CodeLlama评测结果 新闻链接:https://www.163.com/dy/article/ICVUB6EN055240KW.html 澜舟科技:发布孟子GPT大模型,多语言任务表现接近ChatGPT 这次发布是孟子GPT上新。除了基础大模型以外,澜舟科技还同步上线了行业大模型,以及基于大模型的产品应用。 分别是:基于孟子GPT打造的金融大模型。基于孟子GPT打造的会议内容分析平台“澜舟智会”。基于这三方面上新,澜舟科技也表示,未来将全面拥抱MaaS服务,提供基础模型、大模型训练框架/工具包等服务。 图表6:孟子大模型提供MaaS服务