登录
注册
回到首页
AI搜索
发现报告
发现数据
专题报告
研选报告
定制报告
VIP权益
发现大使
发现一下
热门搜索:
新能源车
AIGC
Chatgpt
大模型
新质生产力
低空经济
当前位置:首页
/
行业研究
/
报告详情
/
5-2 老铁智播间:电商场景下的虚拟智能主播 _快手
文化传媒
2022-08-30
DataFunSummit2022:数字人技术峰会
G***
AI智能总结
查看更多
老铁智播间:电商场景下的虚拟智能主播
一、虚拟人介绍
类别
:多种身份,适用于多个场景(虚拟世界互动、虚拟社交等),实现社交新场景。
功能
:作为新工具替代特定场景的人力,降本增效,如虚拟人客服、AI主播等服务型应用,以及虚拟偶像、虚拟代言人等传播型应用。
二、电商虚拟主播
定位
:服务型&AI驱动,实现7x24小时带货直播。
优势
:降低新商家开播门槛,提升品牌形象,丰富电商直播生态。
三、核心技术
表情驱动
通过预测视频中每一帧对应的具体向量,实现面部动作和表情的生成。
语音驱动
基于变分自编码器的风格解藕和控制技术,提高语音的自然度和表现力。
表情语音合成
通过自动生成的人物面部动作和表情参数,增强虚拟主播的互动性和表现力。
形象建模
包括2D卡通、3D卡通和3D写实等多种风格。
自然语言理解
实现智能对话,包括观众进入直播间打招呼、商品QA问题解答等。
视觉智能处理
包括动作过渡与衔接、TTS动作库检索与匹配等。
四、智能交互
关键点
:
行为意图
:观众进入直播间打招呼、点赞、关注。
商品意图
:解答商品相关问题。
其他意图
:进行闲聊类问题互动。
案例
:
“欢迎朱小朱宝宝进入直播间”,“包邮吗?”的回答:“全场包邮哦,喜欢的宝宝们赶紧下单吧~”。
五、语音合成
挑战
:带货风格语音变化多、起伏大、极富表现力,建模难度大。
解决方案
:使用基于变分自编码器的风格解藕和控制技术,显著减轻TTS存在的“一对多”问题。
六、形象制作
定义
:人脸的表情和口型可以通过数十维的向量来控制,每维表示对应区域的幅度。
七、动作驱动
定义
:虚拟人的动作能匹配文案中的台词语义,如“欢迎”时招手、说“很棒”时鼓掌。
目标
:让虚拟人主播更加自然、生动。
八、渲染和推流
流程
:推流动作/表情、语音主播背景展示、商品介绍、前景展示、背景音乐合成渲染、直播间评论信息互动。
九、一站式运营平台
功能
:
一键开关播。
智能文案辅助配置+台词动作匹配。
丰富的预置物料和自定义形象、服装等管理。
十、未来展望
发展方向
:更自然的形象动作,更智能的交互。
应用领域
:扩大买家卖家受众,丰富多元的上下游受众,形成良性循环,与虚拟偶像/代言人联动,推动电商虚拟人生态的发展。
你可能感兴趣
电力设备:省间电力现货市场转入正式运行,进一步拓宽电力交易的场景,有助于“能源转型友好型”发电商
电气设备
中邮证券
2024-10-15
靳智超-京东春晚活动专题:亿级互动场景下的流量治理
信息技术
2024 第22届 GOPS 全球运维大会暨 XOps 技术创新峰会 · 深圳站
2024-05-13
大模型增强下的图智能在金融场景的应用
金融
极客传媒
2024-07-16
计算机行业人工智能系列报告(三):虚拟电厂与智能巡检,电力AI地最佳落地场景
信息技术
华安证券
2023-03-29
2023抖音电商零食销售新趋势-送礼场景与休闲场景下的差异与机遇报告
商贸零售
灰豚数据
2024-01-02