分享主题 大数据+大模型:构建企业新一代 智能分析Agent,释放数据要素价值 岑润哲数势科技|数据智能产品总经理 目录 01数据民主化:实现数据要素价值释放的关键 02解决思路分享:指标平台与AIAgent能力融合,突破数据价值化难题 03落地案例分享:围绕消费零售与金融行业,解析Data+AI如何释放数据要素价值 04总结与展望:重点突破的难点和未来展望 数据民主化:实现数据要素价值释放的关键 当前集中式数据分析的企业现状与痛点 从集中式到民主式数据分析的演进过程 民主式数据分析赋能企业每一个公民实现从数据消费到决策 会员运营团队 门店经理 客服团队 企业集中式数据分析现状:数据需求无限,开发资源有限,需求排队严重 数据 ①需求 ②需求排队 产品运营团队 … ④开发完成 杂乱数据源 数据工程师 … 供应链团队 … ③ 数据开发 IT部门 低 从集中式到民主式数据分析的演进过程 集中式/分散式 民主式 发展阶段粗旷式 阶段特点 小规模、小数据分析 分析可靠性不稳定,不灵活通常在个人层面闭环 中等/大规模数据分析分析效率不稳定,质量差, 依赖路径较长。响应慢 大规模、海量数据分析全体用户级自助式分析 分析到决策制定链路短,响应快 参与人群规模 少数个体 中等 大规模 用户角色 独立分析师 IT开发团队、商业分析师数据科学家、数据分析师 企业公民 分析工具 Excel、SQL、IDETools BI工具、Excel、notebook... 指标平台、大模型、生成式BI、... 分析效能 高 民主式数据分析:让企业内每一个公民可以实现从数据消费到决策 未来 受众群体=95% +业务全员 +上下游合作伙伴 What&Why&How 指标语义层+大模型 过往当前 数据消费者 受众群体=1%业务决策者 What 财务等数据“依赖者” 受众群体=15% +BI分析师 +业务分析师 数据应用核心价值 What&Why 数据分析工具 Excel数仓+BI 解决思路分享:指标平台与AIAgent能力融合,突破数据价值化难题 数据业务化:以指标体系和指标平台弥合业务人员与技术人员的数字鸿沟,实现数据即业务 数据价值化:为人人配上数据智能小助手AIAgent,让数据获取和洞察像聊天一样简单 数据业务化:以指标语义层和指标平台弥合业务人员与技术人员的数字鸿沟 •统一语义层(UnifiedBusinessSemanticLayer)是现代数据栈中的一个独立且可互操作的部分,它位于数据源与数据使用者之间。统一语义层使得所有的数据端点,无论是BI(商业智能)工具、嵌入式分析,还是AIAgent,都能使用相同的业务语义和底层数据,从而得到一致且可信赖的洞察。 数据源统一语义层数据应用 指标语义层怎么建:仓内语义(NL2SQL)繁琐复杂,业务指向性差 •ODS->DWD->DWS->ADS,语义建在哪一层? •数据产品经理、数据开发、终端数据使用者,谁来建数据语义? 带有维度的轻度汇总表 BI工具 维度宽表 数据集存储及加工 指标呈现 事实维度宽表V2.0 数据同步 事实明细表 数据大屏 数据集3 2 数据集 1 数据集 数据应用表n 数据应用表3 数据应用表2 数据应用表1 带有维度的轻度汇总表 交易人数25,000 支付人数22,000 访问人数100,000 交易人数22,000 数据上传维度 维度表 事实明细表 维度表 原始数据表n 原始数据表3 原始数据表2 原始数据表1 … … 数据湖 数据仓库DW层 数据仓库集市层 数据应用 指标语义层怎么建:仓外语义灵活便捷,更加贴近业务 •数据建模右移,更贴近数据消费endpoint,更便于LLMAgent规划推理; •基于虚拟层做数据编织,口径管理更灵活、便捷 维度表 原始数据表1 规范化加工原子指标、维度等 原子指标 统计周期 月至今 借款人数 贷款页浏览人数 原始数据表2 事实明细表 原始数据表3 昨日 事实明细表 积木式组装派生和衍生指标 昨日A渠道借款人数 ➗ 昨日A渠道贷款页访问人数 = 昨日借款转化率 指标API服务 DataAgent 指标语义层: BI 工具 •指标字段 •所需维度 •统计周期 •聚合方式 •约束条件 数据大屏 … •统计步长 原始数据表n 维度表 渠道期限 指标语义层(由指标平台低代码实现) 元数据信息 借款转化率周环比 维度 数据湖 数据仓库DWD 数据应用 DataAgent怎么建:仓外语义LLMAgent方案--NL2semantic 结合大模型+指标分析平台,NL2semantic,提供更优方案 用户 对话式数据查询 数据查询任务 查询结果输出 大语言模型 指标定义 企业数据中台 意图理解指标查询 指标SQL转换 SQL服务 意图理解&指标关联 指标转换 用指标关联的SQL做数据库查询 ①数据可信,准确率高 •预设数据指标的定义与管理,避免业务理解对不齐 •借助思维链分析与歧义反问,提升泛化性,避免直接从文本到SQL ②学习成本低 •无需对大模型做预训练,仅需依据指标语义和知识库做用户意图理解,增强prompt语义 •全流程白盒,企业客户用业务语言描述查询过程,方便快速排查 ③性能提升且稳定 •基于自研的数据查询加速引擎,智能优化查询语句 •P95可实现从检索到回答的秒级出数 ④数据安全可保障 •利用指标分析平台的权限管理能力,结合RBAC基础,对数据与指标进行精细化的权限管控,实现数据查询的安全可控 ⑤能力覆盖更全 •高级数据分析问题,可通过精准的指标进行关联与展示,实现单项数据可查、报表可展示、总结报告可生成 DataAgent方案创新点:NLtoSemanticsvsNL2SQL 场景数据分析诉求 任务难度系数 难点 NL2SQL NLtoSemantic 1 最近7天A门店的订单量是多少? 枚举值转维度 可实现 可实现 2 XXX商品今年累计卖了多少? 枚举值转指标语义维度模糊 可实现但不准 可实现且准确 3今年XX商品的交易金额与退货金额分别是多少? 指标语义模糊 跨表多指日维度上 标查询卷年维度 难实现 可实现且准确 4XX品牌最近3个月销量最好的Top3商品是哪些?这三个分别的好评率是多少?帮我解读下 多任务指标取数规划 结果排序衍生计算 可实现但不准 可实现且准确 5 华东区XX商品的下单金额周环比为什么下降了? 枚举值转同环比维度计算 多维归因报告解读 难实现 可实现且易理解 s 时间维度 地域维度公司维度 产品维度数据指标数据维度任务指令 解析Data+AI如何释放数据要素价值 智慧门店:万店连锁新消费企业,如何用数势SwiftAgent打造新一代智慧门店经营决策体系 智慧金融:大模型+Agent+指标语义层,提升领导驾驶舱从数据到价值的快速转化。 落地案例分享:围绕消费零售与金融行业, 某零售消费案例背景:承接数字化转型战略,建立一套经营决策的指标分析体系 在原有的数据仓库基础上,构建一套完整的指标体系框架,并帮助其打造一套可供战区负责人(管理团队)和门店督导(一线业务人员)快速使用的低门槛智能数据分析助手,推进数字民主化进程 门店精细化分析场景 顾客 督导 加盟商 总部视角 •大众点评星级 •美团外卖星级 •饿了么外卖星级 •小程序差评率 衡量标准 … 抓体验 落地执行 •渠道GMV •渠道毛利 •门店运营成本 … 抓品质 形成改善策略 •万元盈利率 •GMV •净利 •毛利 抓价格 … 发现问题 •QSC稽核 •红灯绿灯 •新品销售达成 … 抓服务 统一数据资产(指标+标签体系) 构建统一财务经营、门店运营、门店管理、商品分析场景的指标体系,让分析能够进行多维度下钻 》 指标体系设计框架 产品&供应链&外卖 指标x维度 2434 门店管理域 指标x维度 2227 门店运营域 指标/标签x维度 6324 财务经营域指标x维度6029 统一的分析思路 统一的分析语言 产品分析支撑产品上新、营销、下架的管理决策;门店健康度分析赋能管理到执行的运营策略优化 》 》 解决思路:以产品分析和门店运营切入,建设统一的分析思路、语言和工具 统一的分析工具 打造基于统一数据的决策体系和策略诊断的支持工具 管理层决策看板智能数据资产(指标)平台 大模型分析助手 面向门店督导人员的运营指标体系(统一语义层) 门店运营域 门店管理域 商品供应链 稽核类指标 是否监控异常目视化合格率基础服务合格率清洁卫生合格率产品品质合格率食品安全合格率 红线合格率 执行类指标 QSC线上稽核整改完成率 QSC线下稽核整改完成率 是否完成慧运营开店任务上传 是否完成慧运营值班任务上传 是否完成慧运营打烊任务上传 是否完成慧运营周月清任务上传 是否完成慧运营运营管理人员 培训类指标 是否完成 上新产品动作一 是否完成 上新产品动作二 是否完成 上新产品动作三 是否完成 上新产品动作四 是否完成 上新产品动作五 是否完成产品周周训 是否完成督导周周训 奖惩类指标 罚款金额奖励金额奖励事由 管理类指标 门店首单时间 分级类指标 门店分级 运营类指标 督导人数督导平均司龄 督导平均管辖城市数 督导平均管辖店数 门店合格店长配置率 店均店员数 (店长+店员) 完成《店长训》人数 口碑类指标 NPS 小程序差评率小程序 店均差评数 大众点评星级点评好评数 点评差评回复率 点评差评率 门店总览 总门店数 拓新类指标 总加盟商数 新签加盟商数 新签门店数 加盟商带店率 新签转址转让门店数 应营业门店数 营业门店数 新开门店数 新签转址转让加盟商数 平均营业门店数 新开转址转让门店数 净增长营业门店数 地址转让 转址门店数转让门店数 解约&闭店 已闭店门店数 暂停营业门店数 解约门店数 已闭店待解约门店数 商品点踩率商品点赞率流水占比杯量占比 曝光UV进店UV 下单UV 供应链 平均采购价格 供应链平均售价 供应链理论毛利额 供应链理论毛利率 外卖 下单转化率曝光下单率 进店转化率 稽核分数 外卖点评合格率 “门店工作日”任务上传 是否串货 督导积分制督导平均积分 是否完成商学院推送学习任务 是否通过新督导学习 是否通过店长训学习 是否通过累计“回炉”训练 客诉类指标 客诉责任率 本年累计督导离职人数 本年累计店长离职人数 分公司 培训人员在岗率 分公司 营销人员在岗率 美团差评回复率饿了么外卖星级 饿了么差评率 店长打卡完成率 美团外卖星级美团好评数美团差评率 筹建门店数 净增长门店数 试营业门店数 曝光UV(商圈同行前10%均值) 进店UV(商圈同行前10%均值) 是否红灯 广告交易额 下单转化率(商圈同行前10%) 下单UV(商圈同行前10%均值) 进店转化率(商圈同行前10%) 曝光下单率(商圈同行前10%) 提升订单数 饿了么外卖好评数 饿了么 差评率回复率 推广消耗 投入产出比 面向门店督导人员的SwiftAgent助手如何赋能门店稽核(Demo演示) 指标与标签管理 需求管理 质量管理 生命周期管理 分类管理 指标与标签开发 快速配置开发 低代码开发 某金融机构智能分析AIAgent实施架构与支持场景 数据分析场景 (应用) Scenario 信贷业务指标分析信用卡业务指标分析财务指标洞察多维客户画像分析行内经营分析指标洞察财富管理指标分析对公业务指标分析代发业务分析 ······ Application 交互式指标标签查询智能归因与预警 客群画像分析智能报告生成与共享 SwiftAgent数据分析助手 (产品) Layer SemanticLayer DataIntegrationLayer SwiftAgent规划器(用户意图识别、复杂任务拆解、工具调用等)