您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:AI+虚拟人专家交流纪要–20230401 - 发现报告
当前位置:首页/会议纪要/报告详情/

AI+虚拟人专家交流纪要–20230401

2023-04-02未知机构点***
AI+虚拟人专家交流纪要–20230401

嘉宾:虚拟人初创公司产品负责人 虚拟人:从2D卡通形象虚拟人向3D、真人超写真虚拟人发展,GPT4成熟后会从单向传播向交互端演化。之前受众参与感一般,品牌商是将虚拟人作为IP和广告,现在会用智能语音虚拟人来承担助手、陪玩角色等,未来可能会成为宠物、伴侣、助手等,场景包括工作、社交、游戏等。目前应用了包括传媒、游戏、影视、零售、金融等多垂类,核心垂类企业50+,集中在北京上海广东浙江等地,虚拟人产业应用过去增速约40%,25年市场规模达到千亿元。 虚拟人按照体验可以分为 一体化交互式虚拟人制作企业:交互式虚拟人,一般被称作是身份性虚拟人和服务型虚拟人,相芯科技、魔法科技等一体化虚拟人制作:制作单向输出的虚拟人,不具备交互能力,世优科技以及黑镜科技 功能型交互性为主导的公司:追一科技等,是做智能交互起家的公司 虚拟形象和内容制作公司:类似于传统电影制作、美术制作等公司,专业美术团队进行 IP设计,比如数字王国等 IP运营平台和MCN机构:没有技术能力,主要是运营公司,代表公司为大禹文化、凯撒文化 GPT模型使得虚拟人向交互型虚拟人演变,对行业产生较大变化和增量。目前数字人直接服务于C端的公司占比30%,B端占比70%左右。使用AI交互的公司占比30%,单一的形象设计进行内容输出的公司在70%左右。融资情况:当前以虚拟形象和内容制作公司为主;智能交互型虚拟人是最近转型重点,未来会更受追捧 交互式虚拟人目前应用 虚拟助手:浦发银行的理财顾问“小浦”提供金融服务、理财管理等支持 客户场景:解决电商售前售后问题、操作类、应答类、闲聊类服务等,淘宝有数字客服出现 C端APP:比如百度度晓晓虚拟助理,交互后提供信息搜索、推荐互动等功能,后续可能会把文心一言能力赋能到度晓晓中,从而具备类似于 ChatGPT的能力。 虚拟员工:主要是进行企业降本增效,万科虚拟人崔小盼进行异常工作流程检测、催办逾期单据等;科大讯飞讯飞之星爱加可以实现工作流程自动化,提升员工效率。 直播带货场景,虚拟人为品牌代言和带货,实时虚拟直播线下场景和真人互动 纯虚拟场景:游戏场景,GPT赋能NPC等游戏角色,玩家可以和NPC进行互动,增强玩家游戏体验。超参数公司利用AI技术赋能NPC角色在游戏世界中生活、生产、交互等,从而产生新的游戏故事和交互,从而形成一个类似于虚拟人世界观察的研究 国内公司在智能交互赋能虚拟人的应用 大厂:1)百度:度晓晓等,可以接入文心一言;2)腾讯:游戏场景、AR场景;3)阿里巴巴:营销、直播带货虚拟人,借助阿里云的能力服务中小商家用虚拟人在直播间带货;4)科大讯飞,B端政府、金额场景;5)数字王国:教育影视制作;6)匠心科技:3D虚拟人 进行直播交互、车载虚拟人、金融/党建等虚拟人交互; 7)微软小冰:闲聊型智能交互虚拟人;8)网易伏羲: NPC虚拟人;9)中科深智:提供低成本智能交互直播机器人,PK头部高成本的虚拟人。国外公司 Genies公司:服务个性化生成需求;Open:打造个性化人工智能虚拟形象,进行区块链相关应用部署;AWW:用海量人体动作和表情数据模拟逼真的虚拟人进行交互;Soulmachine:利用智能和情感反映的模拟技术进行对话,应用于电商、教育、医疗领域目前虚拟人综合指数较高的:百度度晓晓、科大讯飞爱加、小米小爱同学、阿里 ayayi等,技术方面,百度虚拟人与交互技术结合较好。虚拟人目前比较好的应用方向,是具备背景故事、人格特征以及记忆载体,赋能图书馆的讲解能力;或者在互联网中形成新的身份进行交互,和人类交互并完成任务。现在虚拟人还涉及法律问题:1)深度合成技术边界;2)隐私安全问题;3)网络犯罪、虚拟人犯罪的管辖问题等。技术发展快于法律完善速度,未来要加快完善相关法律速度。Q:虚拟人制作成本和毛利率?加入AI后公司的收费和毛利率会如何变化?A:完全没有任何交互的虚拟人:用于广告、影视制作等,单向内容输出为主,其中纯3D虚拟人成本包括美术 设计(和设计师相关,低级设计师几百到几千,高级设计师是几十万-几百万)+3D建模(成本较为固定,和精度有关。精度较低约几百元;超写实的3D数字人工作周期 比较长,可能需要一个月左右的工期,几万到几十万左右成本)+骨骼绑定(成本较固定,2-3工作日,成本约一千元左右)+动作驱动和渲染 (依赖服务器和动捕设备,高精度虚拟人要求的设备等要求较高,成本范围在几千到几十万,甚至上百万)。综合来看,纯3D虚拟人成本范围较广,高精度的可能上百万,低精度的可能几千元。 2D真人虚拟人:通过拍摄一段时间来驱动虚拟人说话 等,只是根据面部驱动技术来进行换脸等,动作是以真人为主,根据面部驱动的神经网络决定(低级别的是一千元左右,高级别的可能几十万)一般直播用的就是千元左右,央视级别用的可能是几十万。 目前行业没有形成标准的报价和利润率,定制服务的利润率可能很高(50%-80%),云端服务的标准化产品低一些(20%-30%)。含AI交互功能的虚拟人:报价也不透明。考虑研发成本可能是亏的,如果不考虑研发成本,目前利润率可能是70%-80%。 成本:1)虚拟形象制作成本;2)AI交互功能以及与虚拟人结合的成本(如果是一路并发e.g.:直播单向回答问题,成本是1000元左右;多路并发是乘以多路的成本;目前 10路以内比较多,1万左右的成本);3)交互与虚拟人 打通的成本,虚拟人和对话系统是定制化的报价,平均成本1w左右。 总的来看,智能交互的虚拟人2W左右交互成本+虚拟人制作成本(1万到几百万)。最简单的面向C端消费者或者长尾应用的虚拟人,成本约 1-2万左右;高定定制化版本的,成本在几十万-上百万之间。 Q:创业公司如何接AI交互?接文心一言还是海外GPT? A:国内主流方式都是接入百度文心一言,一般大B端客户或G端客户只能接文心一言, ChatGPT不能官方接入。此外,科大讯飞、微软小冰也在自研。 此外,很多创业者倾向于接ChatGPT。接入AI的工程难度不是很高,一般就1-2万,但用途主要是C端或小B或者直播量不大的直播间等。 Q:文心一言接入的实际效果? A:差4.0很多(可能2年左右才能追赶),差3.5是半年或1年左右的时间。差距体现在:1)推理能力(最主要),计算题、逻辑推理题目的表现较差;2)多轮交互 较弱;3)涉及到图像表现较弱。此外,表现好的是客服场景,比如有温度、人性化的回答方式,主要是搜索引擎中可以检索到的答案以更人性化的方式回答。文本续写、文本润色等也表现不错。 Q:现在虚拟人交互工作流是语音转文字-与机器人对话-机器人输出后文本转语音? A:目前是这样的,未来4.0也在做直接识别语音文件的技术。未来多模态数据的直接识别可能实现,此外也可能会识别语音语调等信息。现在工作流是语音转写为文字-与对话机器人对话-机器人输出-文本转语音-驱动虚拟人说话。 Q:目前AI+虚拟人应用受限?A:目前应该还没有达到效果非常好的阶段,但未来可能音频信息会被很快学习。现在的想法是培养场景,培养前期用户使用习惯,半年之后交互体验可能会有一定升级。当前虚拟人 +AI的ROI并不高,目前主要是共创的阶段,互相学习和培养用户体验,还没有达到真正为产业工作流产生收益的阶段。Q:虚拟人制作是一次性成本,交互成本是每月的成本?目前主要的应用场景?价格是否有进一步下降空间?A:是。传统虚拟人主要应用在1)品牌端的宣传(打造 IP输出图片、视频、直播内容等),造价在几十万左右; 2)直播间24H引流(填补人类不能直接直播的时长,之前是单向输出的虚拟人)的虚拟人,造价在几万左右。虚拟人成本在逐步下降,之前高精度虚拟人需求比较少,需要重新做,现在高精度虚拟人需求提升,可以利用之前已有的虚拟人进行微调,二次雕刻的成本就会降低很多;目前3D引擎也有相应技术和成本优化,因此成本可能压缩在10w以内。 Q:未来虚拟人需求展望? A:过去每年市场增速是40%左右,25年市场规模是千亿左右。现在虚拟人已经跨越了恐怖谷,被更多人接受,但现在虚拟人的热度没有之前火爆,现在视觉输出的虚拟人增速放缓 (可能是20%-30%);但交互式虚拟人增速可能会增长 (暂时不太好估计,预计约70%-80%)。Q:此前的虚拟人公司还有先发优势吗?现在核心竞争要素是什么? A:目前的壁垒主要在智能交互,之前在虚拟人形象制作有先发优势的公司可能会变小,但还不一定完全消失,只是可能该优势没有那么重要了 (视觉体验的需求一直存在)。但视觉呈现技术和智能交互技术门槛差距很大,智能交互可能只有大厂做得很好。

你可能感兴趣

hot

元宇宙虚拟人-专家纪要

未知机构2022-01-13