您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[腾讯]:2D小样本数智人产品方案 - 发现报告
当前位置:首页/其他报告/报告详情/

2D小样本数智人产品方案

2024-01-10腾讯玉***
2D小样本数智人产品方案

2D小样本数智人产品方案 从大企业专属走向更广泛商用市场,“普惠化”“场景化”趋势明显 成本 从百万级到千元级别 效率 时间从月->周->天->小时级 个性化 每个人都可以拥有自己的“数字分身” 数字人发展的三个阶段 数字分身技术的发展,在科技力营销、 本地生活直播及口播知识生产上带来新的变量 科技力 品牌形象建设 营销获客转化 虚拟品牌代言人虚拟主播 虚拟偶像 生产力 省时、省力 省成本 虚拟主播虚拟客服 ToB 3D写实数智人 金融/传媒/政务/零售/地产 3D卡通数智人 文旅/传媒/车机/家居 2D真人数智人金融/传媒 数字人营销方案数字人直播方案 数字人口播知识生产 ToB、ToC 2D小样本数智人 泛互/金融/医疗/教育/… 数字陪伴数字助手 …… ToC 3D写实、半写实数智人 1、以大企业定制为主:成本高,周期长、数量少 2、营销需求为主:品牌形象提升为主、营销获客转化效果待提升 3、是2022年上半年以前的主要服务方向 1、“数字分身”带来行业新机会:受众广,普惠化趋势明显 ——如金融行业的投顾、保险、销售代理人等,营销新热点方向 ——本地生活数字人直播,增加直播服务时长 ——医生、律师、讲师等专业人士以短视频形式进行知识分享,解决时间不够、镜头不适等困扰 2、是2022年下半年至目前的主要服务方向 AI技术发展,迅速提升3D数字分身复刻、生成、驱动表现力效果以及效率 提供1-3分钟视频、100句语音,即可快速生成和真人一模一样的数字人分身,五官、动作、表情完全模仿真人。 您仅需要输入文字或声音,即可快速生成数智人播报视频。适用于内容讲解、口播视频生产、直播带货等需要真人出镜的场景,节约成本,全年无休。 刘兴亮视频 2.mp4 数字分身产品技术新进展 支持4K高清版本——数智人更逼真,覆盖更多的应用场景 随着技术的不断发展,1080P在一些应用场景下已经不能满足用户需求,更清晰的数字人需求日益增加; 在面对面对话、产品发布会、大屏的场景,高清数字人都能使数字人的表现更加真实和逼真。 支持2D小样本通用口型——无需训练,1小时得到专属数智人 2D小样本-专属口型:经过8个小时的训练,算法会学习原始视频里本人的唇齿,定制完成的小样本数智人的唇齿效果和本人完全一致。 2D小样本-通用口型:无需训练,小样本通用口型模型会根据脸型去预测唇齿,定制完成的小样本数智人的唇齿效果和本人相似,但不完全相同。 支持使用播报apaas接口视频时: ①指定首帧和尾帧生成视频,为不同的文字&语音配置不同的动作片段(示例1&示例2) ②支持查询“带帧号的闭嘴视频片段”,便于选择合适的帧号(示例3) 算法自动挑选出适合“说话态”和“倾听等待态”的视频片段 在数智人不说话时能保持在“倾听等待态”的动作片段,效果更加自然(如下示例2) 功能使用门槛:需要对录制的素材有一定的要求,详见录制指引。 支持首尾帧归位,即视频的开头和结尾,数智人的动作保持一致 不同的视频片段连接自然 应用场景:虚拟直播、在线课程等 •• •• 支持随手用手机拍摄的视频(专属口型效果) 一站式生产管线——T+1即可完成数智人训练到应用 一站式生产线:覆盖“上传素材→自动化训练→一键授权→平台应用” 各个环节透明:客户可自助查询各环节状态,随时了解定制进展 Step1:录制素材准备 Step2:平台自助上传及效果确认 Step3:自助上架及应用 业务模块 流式TTS播报 文档实时生成对话 aPaaS/SDK 交互界面 大屏/H5 对话大模型 数智人 语音 感知 文图像采集 本 人脸/手势识别 用户 理解 NLP ASR 表达 动作驱动 前端UI组件 口型驱动 实时生成问答 TTS纠正标注 大模型数智人PaaS服务 多模态问答 动作预测富文本解析&播报 支持配置平台一体化,完善对客调优工具能力 流式回复语文本接收 重点能力 大模型数智人交互 当前可支撑大屏/API/H5等接入场景POC及交付 用户提问时,数智人自动进入倾听等待状态,无多余手部动作 支持图/表/链接/列表 等多模态流式播报 数字分身应用案例 刘兴亮老师是著名的数字经济学者,自16年开始制作自媒体节目《亮三点》,单期节目半小时,每周一期。近年来为顺应短视频用户群体的习惯,节目调整为日更,单期节目浓缩至2-3分钟,刘老师节目制作极大的挑战。 风平智能是一家AIGC平台的科技公司,使用腾讯数智人技术,批量定制一批数智人形象作为其平台共享主播,同时支持传媒/本地生活等商家定制专属主播,使其短视频&直播平台具有更强的竞争力。 流量增长快 •抢占闲时流量,长时间直播不断线 落地成本低 •数智人价格低于真人主播,且能够支持7*24小时在线 品牌增效 •打造商家自主IP,增强记忆点 互动玩法多 •虚直播间支持直播间问答互动、真人接管等玩法,提升用户互动体验感 •2020年中国本地生活服务市场规模为19.5万亿元, 预计到2025年会增长到35.3万亿元(艾瑞) •商户庞大,抖音本地生活商家数量约100万, 2022年Q3,美团商家数量约930万(白皮书) 将数字人直播用于门店日常引流,每个门店只需要一台电脑即可开播。并且只要配置好常用知识库,数字人堪比门店专家!它还支持连锁商家多店规模化开播、方便总部把控直播内容质量,通过数字人直播团购源源不断引流到店。 •2020年本地生活服务市场规模为19.5万亿元,预计到2025增长到35.3万亿元(艾瑞) •商户庞大,抖音本地生活商家数量约100万, 2022年Q3,美团商家数量约930万(白皮书) •本地生活商户多数为中小商家,预算有限; •每个门店真人直播运营成本巨大; •直播专业性增加,从直播脚本到摄影; •从“播不起”变成了“不会播”、“不能坚持播”是 常态 定力科技是专注于财富零售服务领域的创业公司,帮助财富机构提供投资者管理服务,贯穿获客、转化、服务全用户生命周期的解决方案,打造了场景化模版方案,结合小样本数智人制作代理人数字分身,解放投资顾问生产力,提升营销转化率。 客户点击率60% 视频完播率80% 客户互动率提升5倍 发50个客户,就有6到8个高意向 一键生成 丰富合规的短视频、直播素材 3 4 5 6 推途科技是一家专注于中小微企业营销解决方案的公司,通过数智人打造集短视频内容创作、视频生产、新媒体运营一体化的短视频创作营销SaaS,让企业低成本高效率生产出优质的口播短视频,快速布局短视频营销矩阵。  ••   •• 客户背景:山西颇具名气财税机构,为小微企业提供一站式创业服务。财税行业属于高单价低频的服务,需要通过知识口播来公域引流获客,私域建立信任与转化。 客户痛点:老板本人和团队都有建立不同的账号做视频获客,效果也不错,但一条口播视频从创作到拍摄到剪辑到分发运营需要花费30-60分钟。但精力有限、视频拍摄成本高,视频发布的一直断断续续。 推途云方案:过推途云数字人短视频SaaS,客户老板使用个人定制数字人,员工使用共享财税专家形象,再配合软件不断更新的剪辑模板,实现了高效创作和分发。 落地效果:单条视频输入文案/音频一分钟完成口播视频创作。单条视频制作成本仅需2-3元。真正实现了企业低成本高效率矩阵化地短视频运营。 微媒专注于数字会议平台,提供多元化的线上会议服务,主打大屏互动、云会场等,已有13W注册用户。将小样本数智人集成,应用在线上会议场景中进行数智人演讲、串场主持。 缩短讲师内容制作周期 • 300% 降低人力、生产成本 •无需线下场地、设备等支出,原本多岗位协同,现在一人可承担。 快速迭代创作内容 代 •修改个别段落文家无需重新录制,快速迭迭 集中核心精力创作 •讲师只需关注内容,不再受拍摄等分散精力 —— —— 用友是全国最大的ERP管理软件厂商,员工2.5万人,服务国内众多企业级客户。23年4月19日是用友全球技术生态大会,在此次大会上进行用友商业创新平台(BIP)结合腾讯数智人打造的数智员工首次亮相,同时副总裁罗小江使用其分身进行新产品推介。 医微讯是一家为医疗行业提供数字技术内容,将移动互联网和 虚拟现实技术相结合应用于医疗及相关行业的公司。 树兰医院以一家三级甲等综合医院,由李兰娟院士和其丈夫郑树森发起成立。 赋能药企/咨询机构: 未来会应用于营销及客户服务, 在线学习及培训 赋能医生: 通过打造盛国平博士的分身,帮助其完成“盛博士说”的知识科普内容制作,解放医生生产力。 Thanks