您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国信证券]:人工智能周报(24年第27周):世界人工智能大会点燃模型发布热潮,文生图及文生视频模型多家布局 - 发现报告
当前位置:首页/行业研究/报告详情/

人工智能周报(24年第27周):世界人工智能大会点燃模型发布热潮,文生图及文生视频模型多家布局

文化传媒2024-07-09张伦可、陈淑媛国信证券华***
AI智能总结
查看更多
人工智能周报(24年第27周):世界人工智能大会点燃模型发布热潮,文生图及文生视频模型多家布局

人工智能动态:1)产品应用:腾讯混元开源小显存文生图模型;商汤发布首个所见即所得模型“日日新5o”,交互效果对标GPT4o;金山办公推出WPS AI2.0;快手文生图大模型“可图”开源,多模态大模型可灵AI,功能开放使用;B站发布自研的大语言模型;阿里达摩院推出一站式AI视频创作平台-寻光;Meta发布3DGen模型,文生高质量3D内容;甲骨文发布HeatWaveAI,助力数据库建设。 2)底层技术:谷歌DeepMind研究团队提出了一种加快AI训练的新方法——多模态对比学习与联合示例选择(JEST),大大减少了所需的计算资源和时间;无问芯穹发布异构分布式混合训练系统,千卡异构混合训练集群算力利用率算力利用率可达97.6%。 3)行业政策:2024世界人工智能大会暨人工智能全球治理高级别会议发表《人工智能全球治理上海宣言》;巴西国家数据保护局将禁止Meta使用来自巴西的数据来训练其生成式AI模型。 投资建议:整个上半年,港股互联网各龙头公司已表现出微观基本面筑底回升的特征,尽管宏观经济仍表现出一定压力,我们观察到腾讯的主业游戏海外流水已率先回暖、美团外卖业务每单盈利能力在Q1也开始环比回升、美团本地生活业务跟字节的竞争也逐步走向差异化方向等,我们认为现在正处在微观企业经营效率的小周期回升的起点,因此将推动港股互联网板块开启长期基本面修复行情。此外,各家互联网公司今年以来陆续推出大额回购计划,整个上半年腾讯、美团、快手的回购金额分别为523亿/77亿/9.7亿港元。目前港股互联网公司多数交易在24年经调整净利润15-20x水平,相比较美股纳斯达克科技巨头多数交易在24年PE25-30x,整体估值较低,投资价值凸显。我们当前推荐优先配置竞争格局清晰的港股互联网龙头腾讯、美团等。 风险提示:政策风险,疫情反复的风险,短视频行业竞争格局恶化的风险,宏观经济下行风险,游戏公司新产品不能如期上线或表现不及预期风险等。 AI相关网站流量数据 图1:AI相关网站周访问量(百万) 图2:第一梯队AI相关网站周访问量变动(百万) 图3:第二梯队AI相关网站周访问量变动(百万) 图4:第三梯队AI相关网站周访问量变动(百万) 图5:新增聊天、教育类AI相关网站周访问量变动(百万) 世界人工智能大会点燃模型发布热潮,文生图及文生视频模型得到各家重视 (一)产品应用 腾讯混元文生图大模型(混元DiT)今日宣布开源小显存版本,仅需6G显存即可运行,对使用个人电脑本地部署的开发者比较友好。此外,腾讯宣布混元文生图打标模型“混元Captioner”正式对外开源。该模型支持中英文双语,针对文生图场景进行专门优化,可帮助开发者快速制作文生图数据集。 商汤科技发布“日日新SenseNova5.5”大模型体系,并发布国内首个所见即所得模型“日日新5o”,交互效果对标GPT-4o。“日日新5o”能听、会看、更会找话题,就如同“真人聊天一般”,这种交互模式适用于实时对话和语音识别等应用,能够在同一模型中自然处理多种任务,且根据不同上下文自适应调整行为和输出。日日新5.5是国内首个正式发布的流式原生多模态交互模型,模型训练基于超过10TBtokens高质量训练数据,包括大量高质量的人工合成数据,构建了高阶思维链。模型采用混合端云协同架构,拥有6000亿参数,可最大限度发挥云边端协同,达到109.5字/秒的推理速度。 金山办公宣布升级AI战略,并正式发布WPS AI 2.0。其包含WPS AI办公助手、WPSAI政务版等应用,并首次公开了13B级别的政务自研模型——金山政务办公模型1.0。WPSAI2.0为个人用户新增了4个AI办公助手,分别为AI写作助手、AI阅读助手、AI数据助手、AI设计助手。 图6:WPAAI2.0 快手今日宣布可灵AI网页端正式上线,所有功能限时免费(需自行申请)。“文生视频”开放最长10秒生成能力,“图生视频”新增运镜控制、自定义首尾帧等功能。IT之家实测,可灵AI网页端提供AI图片、AI视频以及即将上线的视频编辑三大板块。AI图片可以登录后直接使用,用户通过文字描述即可获得自动生成的图片,另外还可以添加参考图使用。AI视频支持最长3分钟的高清视频生成。 快手文生图大模型可图正式开源。快手“可图”大模型于今年5月对外开放,目前已经上线网页版和微信小程序,支持文生图和图生图两类功能,可用于AI创作图像以及AI形象定制。在AI创作模块,用户只需输入描述文字并选择期望的画作风格,即可快速获取专属的AI画作。其中,画作风格可以选择默认、皮克斯、卡通盲盒、新海诚、动漫3D、怀旧动漫、电子游戏、水彩插画、莫奈油画、高清写实等。 2024世界人工智能大会(WAIC2024)期间,阿里达摩院推出了一站式AI视频创作平台——寻光。官方表示,该平台旨在通过AI技术使视频创作更简单、高效,其集成了剧本创作、分镜设计、视频素材编辑等关键步骤,创作者可以从构思到成品,在该平台上完成视频创作全过程。据介绍,寻光包含如下功能: 1)故事板生成:一键创建分镜故事板。“从剧本到分镜,让AI辅助你的导演创作之旅,无需再凭想象,画面油然而生。” 2)定制故事角色:由AI为用户定制专属的“演员”。 3)视觉素材自由创作:由AI根据用户想法生成具备一致性的角色和场景画面,再利用运镜控制、运动编辑创作影片。 4)视频内容可控编辑:AI素材和实拍素材都可使用各类视频编辑(如目标新增、目标消除、目标编辑、风格变换、图层拆解/融合等)。 B站自研的大语言模型系列也在此次WAIC 2024大会上首次展出,包括开源的Index-1.9Bchat和Index-1.9B character两个模型。Index-1.9B系列模型于6月开源,包含基座模型、对照组、对话模型、角色扮演模型。Index-1.9B base:基座模型,具有19亿非词嵌入参数量,在2.8T中英文为主的语料上预训练,多个评测基准上与同级别模型比处于领先;Index-1.9Bpure:基座模型的对照组,与base具有相同的参数和训练策略,不同之处在于过滤了该版本语料中所有指令相关的数据,以此来验证指令对benchmark的影响;Index-1.9Bchat:基于index-1.9B base通过SFT和DPO对齐后的对话模型 ;Index-1.9B character:在SFT和DPO的基础上引入了RAG来实现fewshots角色扮演定制。 Meta公司昨日(7月2日)发布研究论文,介绍了名为Meta3DGen(3DGen)的全新AI模型,可以在1分钟内基于用户输入的提示词,生成高质量的3D内容。Meta公司表示Meta 3DGen(3DGen)所生成的3D内容具备高分辨率纹理和材质贴图,还支持基于物理的渲染(PBR),并能对此前生成的3D内容重新再生成新纹理。 甲骨文公司宣布正式推出HeatWave GenAI,其中包含数据库内大语言模型、自动化数据库内向量存储、可扩展向量处理,以及基于非结构化内容进行自然语言上下文对话的能力。这些新功能使客户能够将生成式AI的功能应用于客户数据,不需要具备AI专业知识,也不需要将数据移动到单独的向量数据库中。HeatWave GenAI将立即提供,且无需HeatWave客户额外付费。新推出的自动化和内置生成式AI功能包括:数据库内大语言模型:简化生成式AI应用的开发,且成本更低;自动化数据库内向量存储:支持客户将生成式AI与业务文档结合使用,而无需将数据移动到单独的向量数据库,也不需要具备AI专业知识;可扩展向量处理:高效率提供语义搜索结果,且准确性高;HeatWaveChat:是MySQLShell的Visual Code插件,提供图形化界面,允许开发人员使用自然语言或SQL提问。 (二)底层技术 谷歌DeepMind研究团队提出了一种加快AI训练的新方法——多模态对比学习与联合示例选择(JEST),大大减少了所需的计算资源和时间。JEST以13倍更少的迭代次数,以及10倍更少的计算量,超越了最先进的模型。论文使用了在线模型近似的方法以及效率较高的FlexiViT架构,只使用降低分辨率的32×32的patch来评估「超级batch」,与全分辨率、patch大小为16×16的方法相比减少了72%的FLOP,以及67%的挂钟时间(wall-clock time)。此外,论文还提出了进行多分辨率训练的技巧。将每个batch随机分成两半,使用不同分辨率编码后再拼接起来,提升了评分过程和训练的效率。 无问芯穹在世界人工智能大会AI基础设施论坛上发布了无问芯穹大规模模型的异构分布式混合训练系统,称千卡异构混合训练集群算力利用率最高达到了97.6%。无问芯穹Infini-AI云平台已集成大模型异构千卡混训能力,是全球首个可进行单任务千卡规模异构芯片混合训练的平台,具备万卡扩展性,支持包括AMD、华为昇腾、天数智芯、沐曦、摩尔线程、英伟达六种异构芯片在内的大模型混合训练。 (三)行业政策 2024世界人工智能大会暨人工智能全球治理高级别会议发表《人工智能全球治理上海宣言》。《宣言》提到,倡导开放与共享的精神,推动全球人工智能研究资源的交流与合作。建立合作平台,促进技术转移与成果转化,推动人工智能基础设施公平分配,避免技术壁垒,共同提升全球人工智能的发展水平。 巴西国家数据保护局当地时间周二(2日)认定,拥有Facebook、Instagram、WhatsApp等平台的社交网络巨头Meta将不得使用来自巴西的数据来训练其生成式AI模型。Meta近期更新了隐私政策,允许公司可将人们的公开帖子用于训练其模型。根据巴西国家数据保护局的公报,Meta此举将会对受影响数据主体的基本权利造成严重的、不可挽回的或难以修复的损害,此次下达的禁令是“预防性措施”。 (四)重点事件预告 7月19日-7月21日:第八届人工智能与虚拟现实国际会议(AIVR2024) 投资建议 整个上半年,港股互联网各龙头公司已表现出微观基本面筑底回升的特征,尽管宏观经济仍表现出一定压力,我们观察到腾讯的主业游戏海外流水已率先回暖、美团外卖业务每单盈利能力在Q1也开始环比回升、美团本地生活业务跟字节的竞争也逐步走向差异化方向等,我们认为现在正处在微观企业经营效率的小周期回升的起点,因此将推动港股互联网板块开启长期基本面修复行情。此外,各家互联网公司今年以来陆续推出大额回购计划,整个上半年腾讯、美团、快手的回购金额分别为523亿/77亿/9.7亿港元。目前港股互联网公司多数交易在24年经调整净利润15-20x水平,相比较美股纳斯达克科技巨头多数交易在24年PE25-30x,整体估值较低,投资价值凸显。我们当前推荐优先配置竞争格局清晰的港股互联网龙头腾讯、美团等。 风险提示 政策风险,疫情反复的风险,短视频行业竞争格局恶化的风险,宏观经济下行导致广告大盘增速不及预期的风险,游戏公司新产品不能如期上线或者表现不及预期的风险等。 免责声明