您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国联证券]:传媒2024世界人工智能大会:聚焦AI多模态、产品化 - 发现报告
当前位置:首页/行业研究/报告详情/

传媒2024世界人工智能大会:聚焦AI多模态、产品化

文化传媒2024-07-10丁子然国联证券F***
传媒2024世界人工智能大会:聚焦AI多模态、产品化

行业事件: 2024年7月4日,世界人工智能大会在上海召开。参与公司数量超过500家,包括百度、腾讯、阿里巴巴等头部互联网科技大厂,也包括MiniMax、百川智能、阶跃星辰等明星AI创业公司。整体来看,和2023年WAIC相比,国内AI大模型“百模大战”进入下半场。在模型能力(特别是多模态生成能力)持续迭代的同时,垂直领域的AI应用落地,以及商业化方式的探索,成为大模型公司关注的焦点。 科技大厂:聚焦多模态生成能力,加强自身业务协同 国内头部互联网科技企业是AI大模型最为积极的参与者之一。2024年发展路径更为聚焦:1)多模态生成能力,如快手“可灵”开放网页版、性能较此前进一步升级,目前视频生成数量已达700万;商汤推出对标GPT-4o的多模态大模型“日日新5o”,以及视频生成模型Vimi,可稳定生成1分钟人物类视频。2)推出Agent智能助理:如蚂蚁集团推出的“支付宝智能助理”,连接支付宝内挂号、订票、充话费、餐饮订单等多个生活场景,有望成为用户的贴身生活助理,在本次展会中获得高关注度。3)与自身业务加强协同:其中阿里云30%的新增业务代码由智能编码工具“通义灵码”编写,推动研发效率提升10%;网易即将上线的《永劫无间》手游中将落地首个游戏Copilot;哔哩哔哩推出数字分身、AI动态漫等技术,助力站内UGC内容生产效率提升。 AI“新势力”:模型能力持续追赶,AI应用加速落地 在头部大厂之外,多家AI大模型领域的明星初创企业也在过去一年中陆续涌现。和2023年WAIC相比,本届大会中“AI新势力”影响力显著提升。 1)技术层面,百川智能、智谱AI、阶跃星辰均带来最新的自研模型系列,涵盖从文生文到多模态、从通用到行业垂类大模型等多个领域,和头部AI大模型的能力差距有望逐步缩小。2)产品层面,AI新势力企业积极探索产品及商业化落地方向。其中MiniMax已推出海螺AI、星野等头部C端AI应用,抢占用户心智;阶跃星辰与上海电影合作,有望以国民级IP触达广泛用户;百川智能、智谱AI通过与医疗、智能驾驶、金融等垂直领域的政企合作,持续积累产业Know-how及企业级用户。 投资建议 从产业生态来看,2024年国内AI大模型技术层面依旧格局未定。在保持模型能力持续迭代的同时,AI产品落地及商业化能力成为头部大厂及初创企业共同关注的焦点,其中在搜索问答和情感陪伴领域已率先出现旗舰级应用。 我们认为,在海内外AI大模型“提质降价”的背景之下,AI C端应用有望加速落地。建议关注:1)AI C端应用落地较快的昆仑万维、盛天网络;2)估值低位、基本面较优的游戏标的恺英网络、巨人网络。 风险提示:AI应用落地不及预期风险,行业竞争加剧风险,政策监管风险。 1.2024年世界人工智能大会召开,AI应用生态加速落地 2024年7月4日,世界人工智能大会在上海召开。参与公司数量超过500家,包括百度、腾讯、阿里巴巴等头部互联网科技大厂,也包括MiniMax、百川智能、阶跃星辰等明星AI创业公司。整体来看,和2023年WAIC相比,国内AI大模型“百模大战”进入下半场。在模型能力(特别是多模态生成能力)持续迭代的同时,垂直领域的AI应用落地,以及商业化方式的探索,成为大模型公司关注的焦点。 1.1科技大厂:模型能力和业务协同并重 百度:大模型提质降价,企业端生态加速。1)大模型“提质降价”:在新质生产力发展论坛上,百度智能云宣布文心大模型4.0 Turbo(ERNIE 4.0 Turbo)向企业客户全面开放,输入输出价格分别为0.03/0.06元/千tokens;此外,文心旗舰款模型ERNIE 4.0和ERNIE 3.5宣布大幅降价,ERNIE Speed、ERNIE Lite两款主力模型持续免费,进一步助力AI应用开发成本降低。2)发布千帆行业场景解决方案:目前已优先上线教育、人事、企业服务、文娱、医疗五大行业、20多个场景解决方案。 其中在医疗领域,百度联合杭州全诊医学打造了AI Agent应用“AI医生助理”,助力提升医护人员工作效率、改善病患就医体验;教育领域,与英腾教育联合打造了首个AI医学考试应用产品。 图表1:百度文心多个模型宣布降价 图表2:百度文心千帆发布多个场景解决方案 腾讯控股:混元、元器、元宝三位一体,AI应用多点开花。基于混元大模型,腾讯展区推出了5月发布的“腾讯元宝”,覆盖工作提效(AI搜索、总结、写作),生活娱乐(创意绘画、口语陪练、AI头像)等场景。在“腾讯元器”展区,观众可通过添加提示词、插件、知识库等创建属于个人的智能体,也可以在智能体商店选择、使用他人创建的智能体。此外,腾讯展区还提供了多个C端应用体验:1)XMusic:生成式通用作曲框架,用户上传视频、图片、文字、哼唱等多模态内容,即可生成情绪、曲风、节奏可控的高质量音乐;2)《创造吧!我们的星球》:由腾讯代理发行、以抓宠为核心玩法的手游,提供“成为星球远航者”、“疯狂啾啾城”等轻量AI合成玩法;3)舞动极光:腾讯视频极光TV推出的体感健身应用,用户使用1台智能电视、1台手机即可进行家中健身运动。 图表3:腾讯“混元”“元宝”“元器”展台 图表4:腾讯“舞动极光”展台体验 阿里巴巴:通义灵码、支付宝智能助理引起高度关注。阿里巴巴展区推出“通义十二时辰”,展示了对话、效率、智能体、视觉四个核心场景中的AI助手能力。此外,两项新应用引起大会关注:1)通义灵码:基于通义大模型开发的智能编码辅助工具,目前该插件下载量350万,每天推荐代码超过3000万次,被开发者采纳代码行数超亿行。内部业务协同层面,阿里云目前30%的新增业务代码由通义灵码编写,研发效率提升10%。2)蚂蚁集团旗下“支付宝智能助理”:基于蚂蚁百灵大模型开发的AI生活管家,用户只需在支付宝主界面下拉即可唤起,下达指令后可直连支付宝内挂号、订票、充话费、下订单等服务。如在“智能点单”功能下,用户下达指令“帮我点一杯瑞幸冰拿铁”,AI即可进入小程序自动下单。 图表5:阿里巴巴“通义灵码” 图表6:蚂蚁集团“支付宝智能助理” 商汤科技:发布日日新5o、Vimi大模型,多模态能力持续演进。其中,1)日日新5o大模型交互体验对标GPT-4o,可实现实时的多模态交互。现场演示的功能包括识别现场展示的人物场景、书本内容、简笔画等,并与用户进行相应互动。2)人物视频生成大模型Vimi,基于商汤日日新大模型开发。在可控性方面,Vimi支持视频、动画、声音、文字等多模态输入形式,从而生成和目标动作一致的人物类视频;稳定性方面,Vimi可稳定生成长达1分钟的单镜头人物类视频。 图表7:商汤日日新5o大模型现场演示 图表8:商汤Vimi一分钟视频生成 快手:可灵网页端上线,基础模型再升级。2024年6月,快手推出文生视频大模型“可灵”,支持生成长达2分钟、30fps的1080p视频,使用效果在国产多模态大模型中实现领先。截至目前,可灵已收到超过50万次内测资格申请,视频生成数量达到700万。本次大会上,快手可灵大模型再次更新:1)继图生视频、视频续写功能之后,可灵网页版正式上线,限时免费,集成文生图、文生视频等相关能力;2)可灵AI基础模型升级,创作者单次文生视频时长增加至10秒,此外生成画质、首尾帧控制、镜头控制等能力进一步提升。 图表9:快手可灵视频生成效果 图表10:快手可灵网页版界面 网易:发布多模态智能助手,《永劫无间》手游将上线游戏Copilot。1)自研“易生诸相”多模态大模型,已于2023年12月通过备案,包含“玉言”系列文生文大模型以及“丹青”系列文生图大模型,目前已在网易内部多个场景中落地。现场展示了基于多模态大模型实现升级的智能助手“丹青约”,用户输入描述性指令(如“请帮我带上墨镜”)即可对图像、照片实现修改。2)《永劫无间》手游将推出全球首个游戏Copilot,将打造与真人玩家相近的AI队友,可在战斗中自主跑图、搜物资、战斗、跑圈等,以及开麦与玩家实现语音沟通。《永劫无间》手游将于7月25日正式上线,目前预约人数已突破4000万。 图表11:网易“丹青约”展台 图表12:《永劫无间》手游Copilot 哔哩哔哩:首次展出自研LLM,AI应用站内协同。1)首次展出自研大语言模型系列,开源的Index-1.9B chat和Index-1.9B character,展台现场演示了知识问答、文案创作、逻辑推理、代码生成等功能,助力哔哩哔哩UP主提升创作效率;2)必剪Studio生成“数字分身”:必剪作为哔哩哔哩的自研音视频大模型,可为UP主提供免费的真人模型定制服务,现场观众可通过输入文本或录音,生成实拍级别的出境口播视频;3)AI动态漫画:哔哩哔哩自研的动态漫技术,可通过图文引导和动态控制,将漫画转化为动态视频,有望大幅提升漫画读者的阅读体验,也有望大幅降低站内UGC内容的门槛。 图表13:哔哩哔哩自研大模型能力演示 图表14:哔哩哔哩AI动态漫画效果展示 1.2新势力:AI应用加速落地,探索商业化方向 MiniMax:海螺AI、星野、文生音乐齐亮相,AI应用生态加速落地。作为商业化进程较快的AI大模型创业公司,MiniMax展台演示了多款AI C端应用:1)海螺AI:类ChatGPT的对话机器人类产品,基于MiniMax自研的多模态大模型开发,可帮助用户分析财报、阅读长上下文、创作文案,以及捕捉、理解用户情绪等;2)星野:AI智能体创作平台,用户可自定义生成AI智能体形象、声音、人设、技能等,进而和智能体进行高粘性、长留存的对话交互,共同构建丰富的内容社区;3)文生音乐:通过低门槛的提示词输入,生成自定义音乐内容,目前仍在完善过程中。此外,企业级应用方面,MiniMax开放者平台已服务超过3万家企业和个人开发者,助力其快速开发AI应用。 图表15:MiniMax“海螺AI”界面 图表16:MiniMax“星野”界面 百川智能:聚焦医疗领域应用。基于百川智能自研的Baichuan4大模型,现场展示的应用包括:1)百小应:类ChatGPT的对话机器人产品;2)最新的AI医疗应用“AI健康顾问”:依托于通用医疗增强大模型,拥有丰富的药学知识和医生思维,在用户提出问询之后,能够根据用户的问题持续提问,从多维度深入了解症状。 图表17:百川智能“百小应”界面 图表18:百川智能“AI健康顾问”展台 智谱AI:代码大模型升级,专注企业级用户。1)发布第四代CodeGeeX代码大模型,在GLM-4基础上持续迭代,代码生成能力大幅提升。目前CodeGeeX对个人用户免费开放,用户数量已超过100万;2)展示智谱大模型开放平台bigmodel.cn,面对B端、G端用户的服务平台,一键微调、All Tools API调用等新功能已上线,目前企业级客户和开发者超过40万,日均调用量600亿Tokens。现场演示案例包括新一代智能驾驶、智能投顾助手、公积金咨询助手、智能问诊等;3)为CGTN打造数字人直播平台,其中“AI老罗”以数字人形象在展示区亮相。 图表19:智谱第四代CodeGeeX现象演示 图表20:“AI老罗”数字人形象 阶跃星辰:发布三款Step系列通用大模型,与上海电影IP合作。1)发布三款大模型新品:包括Step-2万亿参数语言大模型正式版、Step-1.5V多模态大模型、Step-1X图像生成大模型;2)展示C端产品矩阵:包括AI智能助手“跃问”以及角色扮演平台“冒泡鸭”。此外,阶跃星辰与上海电影进行IP合作,推出《大闹天宫》AI互动体验,以及《葫芦兄弟》视频生成能力展示。 图表21:阶跃星辰Step系列大模型展台 图表22:智能助手“跃问”界面 2.风险提示 1)AI应用发展不及预期风险:AI搜索技术仍不成熟,技术及产品迭代可能不及预期,导致用户体验不佳。 2)竞争加剧风险:AI搜索行业参与者众多,包括头部大厂、众多中小企业以及创业公司,行业竞争激烈。 3)政策监管风险:若AI大模型、产品政策