海外AI应用进展不断,持续看好行业发展。1)8月8日,Stability Al宣布 发布StableCode,这是其第一个用于编码的大语言模型AI产品。此前Stablity AI已发布过AI绘画模型Stable Diffusion和SDXL1.0。StableCode旨在一 次处理更多代码,具有16000个token的上下文窗口,比之前发布的开放 模型多2-4倍。经Stability Al测试StableCode在OpenAI HumanEval测试 基准上与类似参数规模的编程模型相比表现优秀。StableCode的参数规模 为3B(30亿),在该参数规模上能一次处理大量代码并且开源,是AI在编程 领域应用的一大进步。2)近日斯坦福将生成式智能体项目在Github开源。 今年4月,斯坦福提出了生成式智能体(GenerativeAgents)的概念,即模 拟可信人类行为的计算软件代理。斯坦福实例化生成式智能体来填充受《模 拟人生》启发的交互式沙箱环境,最终用户可以使用自然语言与一个由25 个生成式智能体组成的小镇进行交互。生成式智能体具有超出了项目中沙箱 演示的巨大潜在应用价值,尤其是在受益于基于长期经验的人类行为模型的 领域。比如可以用社交机器人填充论坛,以及虚拟现实元宇宙或物理空间。 3)微软365 Copilot此前宣布定价,AI应用盈利贡献占比有望逐渐提升。2023 年7月18日,微软在Inspire大会上披露Microsoft 365 Copilot定价,即 Microsoft 365 E3、E5、Business Standard和Business Premium客户的价 格将为每个用户每月30美元,在原有产品中均需要额外增加付费。本次 Microsoft 365 Copilot定价大幅超出预期,微软在Inspire大会同时宣布推出 Bing Chat Enterprise,让企业既能将AI聊天应用在工作中,又能确保企业 资料安全。所有进、出的资料都受到保护,让商业客户在自己的掌控下获得 更好的解答,改善效率,以全新的方式发挥创意。凡拥有Microsoft 365 E5、 E3、商务标准版以及商务进阶版授权的客户都能免费使用。未来微软也将透 过单独订阅的方式来提供Bing Chat Enterprise(每位使用者每月5美元)。 OpenAI推出网络爬虫GPTBot,过滤数据版权。8月8日,OpenAI推出 了网络爬虫GPTBot。OpenAI称使用GPTBot用户代理抓取的网页可能会用 于改进未来的模型,并经过过滤以删除需要付费访问、已知会收集个人身份 信息或包含违反OpenAI政策的文本的来源,允许GPTBot访问网站可以帮 助AI模型变得更加准确并提高其总体功能和安全性。同时OpenAI还分享 了网站所有者如何通过robots协议禁止GPTBot访问自己的网站以及允许 GPTBot仅访问网站的部分内容。此前美国专利商标局的公开文件显示 OpenAI于7月18日提交了GPT-5的商标申请,GPTBot能帮助OpenAI从 互联网上收集更多数据来训练自己的人工智能模型,我们认为这意味着 OpenAI有可能正计划或是已经在训练新一代大语言模型。Robots协议是互 联网界通行的道德规范,使用网络爬虫收集数据还需要遵守不侵犯个人信息 等法律规范。我们认为参照OpenAI的做法,使用网络爬虫在法律允许以及 被爬取网站所有者允许的情况下收集更多数据,也可以被其他大模型厂商借 鉴,加速模型的迭代。 英伟达AI芯片进一步升级,有望助力AI应用加速落地。8月8日,英伟达创始人CEO黄仁勋在SIG GRAGH 2023大会上进行主旨演讲,发布了 GH200 Grace Hopper超级芯片平台,内存容量和带宽比当前产品分别增加 了3.5倍和3倍,预计制造商将在2024年二季度交付基于该平台的系统。1 亿美金的数据中心预算下,大约能部署8800台x86CPU芯片平台,能耗约 为5MW,采用GH200芯片平台,只需要3MW能耗,性能预计提升至12 倍。会上英伟达宣布与大模型社区Hugging Face合作并提供超算服务,发 布AI Workbench降低行业进入者门槛,升级软件服务至AI Enterprise 4.0, 此外公司还发布了全新RTX工作站和三款相应GPU,并针对数据中心发布 了基于L40S的OVX服务器。整体来看,我们认为英伟达在算力侧优势进一 步加强,针对中高性能GPU、行业应用生态均有完备布局,全球AI应用有 望加速落地,我们持续看好AI技术变化带来的行业生产力进步。 建议关注:1)算力侧:英伟达、浪潮信息、云赛智联、中际旭创、新易盛、 工业富联、中科曙光、神州数码、拓维信息、海光信息、寒武纪、易华录、 景嘉微等。2)应用侧:金山办公、大华股份、海康威视、科大讯飞、漫步 者、传音控股、千方科技、同花顺、中科创达、鼎捷软件、新致软件、紫天 科技、万兴科技、拓尔思、创业黑马等。 风险提示:AI技术迭代不及预期风险;经济下行超预期风险;行业竞争加 剧风险。 一、海外AI应用进展不断,持续看好行业进展 1.StabilityAl开源30亿参数编码模型StableCode,上下文可达16000个token 8月8日,Stability Al宣布发布StableCode,这是其第一个用于编码的大语言模型AI产品。模型可在开源社区Hugging face下载。此前Stablity AI已发布过AI绘画模型Stable Diffusion和SDXL1.0。 StableCode为开发人员提供了一种独特的方式,通过使用三种不同的模型来帮助他们编码,从而提高效率。基本模型首先使用来自BigCode的堆栈数据集(v1.2)的多种编程语言进行训练,然后使用Python、Go、Java、Javascript、C、markdown和C++等流行语言进行进一步训练。StabilityAl在HPC集群上使用560B代码token训练了模型。 建立基本模型后,针对特定用例调整指令模型,以帮助解决复杂的编程任务。为了实现这一结果,在基本模型上训练了大约120000个Alpaca格式的代码指令/响应对。 图表1:使用StableCodeInstruct生成对给定指令的响应的代码 StableCode长上下文窗口的模型是确保用户可以获得单行和多行自动完成建议的完美助手。该模型旨在一次处理更多代码,具有16000个token的上下文窗口,比之前发布的开放模型多2-4倍,允许用户同时查看或编辑相当于最多5个平均大小的Python文件,对于初学者来说它是理想的学习工具。 图表2:StableCode利用Pytorch深度学习库完成一个相对复杂的python文件(灰色文本显示StableCode的预 Stability Al在OpenAI HumanEval测试基准上将StableCode与参数规模接近的模型进行比较。结果显示在pass@1(一次通过率)和pass@10(10次通过率)上,StableCode均优于replit-coder模型,在pass@10指标上优于starcoderbase模型。StableCode的参数规模为3B(30亿),StableCode在该参数规模上能一次处理大量代码并且开源,是AI在编程领域应用的一大进步。 图表3:StableCode在HumanEval基准与相似规模模型的比较 2.斯坦福AI虚拟小镇开源,推动生成式智能体研究进展 今年4月,斯坦福发布论文《Generative Agents: Interactive Simulacra of Human Behavior》,提出了生成式智能体(Generative Agents)的概念,即模拟可信人类行为的计算软件代理。生成式智能体会起床,做早餐,然后去上班;艺术家作画,作家写作;他们会形成意见、互相关注并发起对话;他们在计划第二天时会记住并反思过去的日子。为了实现生成式智能体,斯坦福推出了一种架构,该架构扩展了大语言模型,以使用自然语言存储代理经验的完整记录,随着时间的推移将这些记忆合成为更高级别的反射,并动态检索它们以规划行为。斯坦福实例化生成式智能体来填充受《模拟人生》启发的交互式沙箱环境,最终用户可以使用自然语言与一个由25个生成式智能体组成的小镇进行交互。在评估中,这些生成式智能体会产生可信的个人和涌现的社交行为:例如,从一个用户指定的单一想法开始,即一个智能体想要举办情人节派对,智能体在接下来的两个时间里自主地传播派对邀请几天,结识新朋友,互相约出参加聚会的日期,并协调在正确的时间一起出现在聚会上。 斯坦福通过实验证明了智能体架构中的组成部分:观察、规划和反思都对代理行为的可信度做出了至关重要的贡献。智能体感知他们的环境,所有感知都保存在一个称为记忆流的智能体体验的综合记录中,基于他们的感知,体系结构检索相关的记忆,并使用这些检索到的动作来确定动作。这些检索到的记忆也被用来形成更长期的计划和创建更高层次的反思,这两者都被输入到记忆流中以供将来使用。 图表4:斯坦福生成式智能体架构 近日斯坦福将生成式智能体项目在Github开源。斯坦福论文认为生成式智能体具有超出了项目中沙箱演示的巨大潜在应用价值,尤其是在受益于基于长期经验的人类行为模型的领域。比如可以用社交机器人填充论坛,以及虚拟现实元宇宙或物理空间。我们认为斯坦福将项目开源有利于全球学界和业界加速对AI在生成式智能体方向的研究和应用落地进展。 图表5:斯坦福AI虚拟小镇 3.微软365Copilot此前宣布定价,AI应用盈利贡献占比有望逐渐提升 Microsoft 365 Copilot定价超预期,有望快速打开收入天花板。2023年7月18日,微软在Inspire大会上披露Microsoft 365 Copilot定价,即Microsoft 365 E3、E5、Business Standard和Business Premium客户的价格将为每个用户每月30美元,在原有产品中均需要额外增加付费。目前Microsoft核心产品365基础版定价6美元/月,标准版定价12.5美元/月,高级版22美元/月,企业版E3定价36美元/月,E5定价57美元/月。本次Microsoft 365 Copilot定价大幅超出预期,同时我们预计Microsoft 365 Copilot订阅用户粘性预计较高,且将有望大幅减少盗版用户从而提升付费用户数。 图表6:微软现有商业版产品定价 微软推出Bing Chat Enterprise,保障用户数据安全,打造潜在付费应用。微软在Inspire大会同时宣布推出Bing ChatEnterprise,让企业既能将AI聊天应用在工作中,又能确保企业资料安全。所有进、出的资料都受到保护,让商业客户在自己的掌控下获得更好的解答,改善效率,以全新的方式发挥创意。凡拥有Microsoft 365 E5、E3、商务标准版以及商务进阶版授权的客户都能免费使用。未来,微软也将透过单独订阅的方式来提供Bing Chat Enterprise(每一位使用者每月5美元)。 图表7:微软全新推出Bing Chat Enterprise 二、OpenAI推出网络爬虫GPTBot,过滤数据版权 8月8日,OpenAI推出了网络爬虫GPTBot。GPTBot可以通过用户代理和字符串来识别。OpenAI称使用GPTBot用户代理抓取的网页可能会用于改进未来的模型,并经过过滤以删除需要付费访问、已知会收集个人身份信息或包含违反OpenAI政策的文本的来源,允许GPTBot访问网站可以帮助AI模型变得更加准确并提高其总体功能和安全性。 同时OpenAI还分享了网站所有者如何禁止GPTBot访问自己的网站,只需要将GPTBot添加到网站的robots.txt