您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[信达证券]:传媒行业:AI生成3D技术加速迭代,关注国内应用映射及落地 - 发现报告
当前位置:首页/行业研究/报告详情/

传媒行业:AI生成3D技术加速迭代,关注国内应用映射及落地

文化传媒2024-03-11冯翠婷信达证券胡***
AI智能总结
查看更多
传媒行业:AI生成3D技术加速迭代,关注国内应用映射及落地

证券研究报告行业研究行业点评传媒行业投资评级 看好 上次评级 看好 冯翠婷传媒互联网及海外首席分析师执业编号:S1500522010001邮箱:fengcuiting@cindasc.com信达证券股份有限公司CINDASECURITIESCO.,LTD北京市西城区闹市口大街9号院1号楼邮编:100031 AI生成3D技术加速迭代,关注国内应用映射及落地 2024年3月11日 近期AI相关热点更新: Anthropic推出其突破性的Claude3系列模型:该系列大型语言模型(LLM)在各种认知任务上树立了新的性能标杆。Claude3系列包含三个子模型,分别为Claude3Haiku、Claude3Sonnet和Claude3 Opus,它们提供不同程度的智能、速度和成本选择,以满足各种人工智能应用需求。在本科与研究生知识、数学问题处理、编码、文本理解方面,均超越了OpenAIGPT-4和谷歌Gemini1.0Ultra。 StabilityAl和国内AI企业VAST合作开源的快速3D物体重建模型TipoSR落地:TipoSR能在1秒内从单张2D图像快速生成高质量的3D模型。这项技术利用先进的人工智能算法,通过分析图片内容,自动创 建出相应的三维模型。TipoSR的目标是简化3D建模过程,使得用户即使没有专业的3D建模技能,也能够轻松地从现有的2D图像中创建出3D内容。TipoSR有着广泛的应用场景:生成的3D对象可以应用于多种领域,如游戏开发、动画制作、虚拟现实(VR)、增强现实(AR)、电影特效、产品设计等。 Mistral发布旗舰模型MistralLarge:MistralAI发布了最强力的旗舰模型MistralLarge,性能直接对标GPT-4。在众多主流基准测试中, MistralLarge力压Anthropic的Claude2和谷歌的GeminiPro,成绩仅次于GPT-4。 亚马逊发布世上最大文本转语音模型:亚马逊人工智能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上 发表了一篇论文,详细描述了模型的开发和训练过程。这个名为“可扩展流式文本转语音模型”(BASETTS)的新模型拥有9.8亿个参数,并使用10万小时的录音(来自公共网站)进行训练。 谷歌正式宣布推出GeminiforWorkspace:Workspace最基本的“Starter”套餐每月每用户费用为6美元,而想要使用“Gemini扩展”需要额外支付20美元(IT之家备注:当前约144元人民币)月费(以 上价格均需签订年度合同)。GeminiforWorkspace的推出标志着谷歌对AI业务产品的一次重大重塑,同时也让谷歌此前混乱、不断变化的AI品牌形象变得更加清晰。此前宣布的DuetAI并未正式面向公众发布,而GeminiBusiness则提供了便捷的购买流程,任何Workspace商业客户都可以轻松订阅该服务。 投资建议: 受益于全球生成式AI持续发展,文生图/视频/音乐/代码等多方面 应用的迭代更新有望长期给诸多行业带来降本增效,重点关注:1)AI+3D:大丰实业、丝路视觉、凡拓数创、恒信东方、风语筑、锋尚文化、岭南股份;2)AI+影视:慈文传媒、华策影视(影视剧 储备丰富+微短剧布局)、上海电影(集团支持+IP优势)、光线传媒(动画电影受益于文生视频进展)、超讯通信、因赛集团、中 广天择。3)AI+IP:华策影视、上海电影、中文在线、奥飞娱乐、果 麦文化、捷成股份;4)AI+营销:分众传媒、三人行、芒果超媒、 易点天下、值得买、蓝色光标、兆讯传媒、浙文互联、遥望科技等;5)AI+教育/阅读:盛通股份、世纪天鸿、掌阅科技等;6)AI+游戏:恺英网络(信达证券3月金股)、巨人网络(《原始征途》表 现优异,24Q1业绩有望高增)、完美世界(2024年困境反转)、紫天科技、昆仑万维、宝通科技、掌趣科技、神州泰岳、盛天网络、 三七互娱、吉比特、名臣健康、姚记科技、顺网科技、汤姆猫、星辉娱乐等;7)AI+办公:万兴科技、福昕软件、金山办公;8)AI+出版:果麦文化、南方传媒、中南传媒、凤凰传媒、皖新传媒等;9)AI大模型:腾讯、百度、阿里巴巴、昆仑万维、科大讯飞等。 风险因素:生成式AI公司资本开支、AI应用迭代不及预期。 日期 公司 事件 3.5 OpenAI OpenAI为ChatGPT推�了名为“朗读”(ReadAloud)的新功能。该功能可以让ChatGPT用五种不同的声音朗读其回复,旨在为用户提供更加便捷的交互体验。目前,“朗读”功能已上线ChatGPT的网页端、iOS和安卓应用。 2.27 Mistral MistralAI发布了最强力的旗舰模型MistralLarge,性能直接对标GPT-4。在众多主流基准测试中,MistralLarge力压Anthropic的Claude2和谷歌的GeminiPro,成绩仅次于GPT-4 3.4 Anthropic 人工智能创业公司Anthropic今日宣布推�其突破性的Claude3系列模型,该系列大型语言模型(LLM)在各种认知任务上树立了新的性能标杆。Claude3系列包含三个子模型,分别为Claude3Haiku、Claude3Sonnet和Claude3Opus,它们提供不同程度的智能、速度和成本选择,以满足各种人工智能应用需求。据官方称,Claude3系列的旗舰模型Opus在本科与研究生知识、数学问题处理、编码、文本理解方面,均超越了OpenAIGPT-4和谷歌Gemini1.0Ultra。此外,所有Claude3模型均擅长分析、预测、细致内容创作、代码生成和多语言对话。Opus和Sonnet目前已集成到Anthropic的Claude.ai和ClaudeAPI中,可在159个国家/地区使用,Haiku将很快推�。Sonnet也可以通过亚马逊云科技的Bedrock服务以及谷歌云VertexAIModelGarden的私人预览渠道获得,Opus和Haiku也将在不久后登陆这两个平台。 3.5 StabilityAI StabilityAl和国内AI企业VAST合作开源的快速3D物体重建模型TipoSR,能在1秒内从单张2D图像快速生成高质量的3D模型。这项技术利用先进的人工智能算法,通过分析图片内容,自动创建�相应的三维模型。TipoSR的目标是简化3D建模过程,使得用户即使没有专业的3D建模技能,也能够轻松地从现有的2D图像中创建�3D内容。TipoSR有着广泛的应用场景:生成的3D对象可以应用于多种领域,如游 表1:海外科技企业近期动态汇总 戏开发、动画制作、虚拟现实(VR)、增强现实(AR)、电影特效、产品设计等。 2.29 NVIDIA 英伟达近日联合HuggingFace和ServiceNow,发布了名为StarCoder2的LLMs系列模型,希望成为代码生成领域的新标准,具备性能、透明度和成本效益等诸多优势。该系列模型包括一个由ServiceNow训练的30亿参数模型、一个由HuggingFace训练的70亿参数模型和一个由英伟达训练的150亿参数模型。StarCoder2经过619门编程语言培训,可以执行源代码生成、工作流生成、文本摘要等专业任务。英伟达表示,开发人员可以利用它进行代码补全、高级代码总结、代码片段检索等,从而提高工作效率。 2.22 Google 谷歌正式宣布推�GeminiforWorkspace,针对GoogleWorkspace用户提供一系列AI辅助功能。Workspace最基本的“Starter”套餐每月每用户费用为6美元,而想要使用“Gemini扩展”需要额外支付20美元(IT之家备注:当前约144元人民币)月费(以上价格均需签订年度合同)。GeminiforWorkspace的推�标志着谷歌对AI业务产品的一次重大重塑,同时也让谷歌此前混乱、不断变化的AI品牌形象变得更加清晰。此前宣布的DuetAI并未正式面向公众发布,而GeminiBusiness则提供了便捷的购买流程,任何Workspace商业客户都可以轻松订阅该服务。 3.8 谷歌近日升级了Gemini聊天机器人,用户和其聊天过程中,可以指定部分聊天内容,进行修改、缩短、扩充等操作。谷歌近日更新了Gemini,让用户只需点击几下,就能修改回复的特定部分。过去,用户必须重新生成整个回复,但现在不再需要这样做了。只需选择要修改的回复部分,然后单击铅笔图标即可进行编辑。 2.27 微软 微软旗下开发者平台GitHub宣布,其生成式AI服务GitHubCopilotEnterprise正式上线。CopilotEnterprise可以根据企业的知识和代码库进行定制,使AI辅助编码在整个软件开发生命周期中起到很大的作用。CopilotEnterprise的推�更多是充分考虑了组织机构经验知识对于开发者的意义。升级后的产品允许团队成员询问有关公共和私有代码的问题,快速了解新代码库,提高工程团队的一致性,确保公司中的每个人都能访问相同的标准和以前完成的工作。GitHubCopilotEnterprise的定价为每月每人39美元 3.9 3月9日消息,微软Bing副总裁MichaelSchechter表示,微软已经开始面向CopilotPro用户推�CopilotGPTBuilder功能,允许用户打造属于自己的自定义AI机器人。 2.18 亚马逊 亚马逊人工智能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。这个名为“可扩展流式文本转语音模型”(BASETTS)的新模型拥有9.8亿个参数,并使用10万小时的录音(来自公共网站)进行训练。 2.23 字节 字节跳动发布了文生图开放模型SDXL-Lightning。据悉,该模型能够在极短的时间内生成高质量和高分辨率的图像,是目前最快的文生图模型之一。字节跳动的SDXL-Lightning模型则采用了一种渐进式对抗蒸馏的技术,实现前所未有的生成速度,该模型能够在2步或4步内生成 极高质量和分辨率的图像,将生成速度加快十倍,是1024分辨率下速度最快的文生图模型,计算成本则降低为十分之一。该模型已经在AI开源社区HuggingFace上公开,跻身模型趋势榜,同时也成为Hugging FaceSpaces上的热门模型。 资料来源:IT之家,StabilityAI,澎湃新闻,51CTO技术栈,细软知识产权,新智元微信公众号,信达证券研发中心 研究团队简介 冯翠婷,信达证券传媒互联网及海外首席分析师,北京大学管理学硕士,香港大学金融学硕士,中山大学管理学学士。2016-2021年任职于天风证券,覆盖互联网、游戏、广告、电商等多个板块,及元宇宙、体育二级市场研究先行者(首篇报告作者),曾获21年东方财富Choice金牌分析师第一、Wind金牌分析师第三、水晶球奖第六、金麒麟第七,20年Wind金牌分析师第一、第一财经第一、金麒麟新锐第三。 凤超,信达证券传媒互联网及海外团队高级研究员,本科和研究生分别毕业于清华大学和法国马赛大学,曾在腾讯担任研发工程师,后任职于知名私募机构,担任互联网行业分析师。目前主要负责海外互联网行业的研究,拥有5年的行研经验,对港美股市场和互联网行业有长期的跟踪覆盖。主要关注电商、游戏、本地生活、短视频等领域。 刘旺,信达证券传媒互联网及海外团队高级研究员。北京大学金融学硕士,北京邮电大学计算机硕士,北京邮电大学计算机学士,曾任职于腾讯,一级市场从业3年,创业5年(人工智能、虚拟数字人等),拥有人工智能、虚拟数字人、互联网等领域的产业经历。 李依韩,信达证券传媒互联网及海外团队研究员。中国农业大学金融硕士,2022年加入信达证券研发中心