
演讲人:王冠军CDO数禾科技 数禾科技简介 数禾科技(全称“上海数禾信息科技有限公司”)成立于2015年8月,是城市生活圈媒体网络分众传媒(股票代码:002027)、知名投资机构红杉资本、服务中国及全球华人社群的领先网络媒体公司新浪等联合投资的金融科技企业。数禾科技以大数据和技术为驱动,为金融机构提供高效的智能零售金融解决方案,服务银行、信托、消费金融公司、保险、小贷公司等持牌金融机构,业务涵盖消费信贷、小微企业信贷、场景分期等多个领域,提供营销获客、风险防控、运营管理等服务。数禾科技通过自主开发的消费信贷产品,连接金融机构与普罗大众,赋能金融机构数字化转型,迎接中国消费升级的大潮。 我们希望打造一个能通过业务语言快速获取数据的语义BI平台 面对精密的数据平台,业务用户往往手足无措 今年以来,每个月信息流渠道新增客户数、新增交易金额是多少? 1.取不到2.不会算3.重复建4.不一致5.算不对 对于数据团队而言,同样面临棘手且复杂的情况 举例:抽数这件事儿 2.可用性 1.大规模 业务团队:数据搬过来 PB/TB量级、多种数据源等 系统稳定性、处理速度和效率等 数据团队需要考虑: 3.质量 4.安全 准确性、完整性、一致性、可靠性等 分类分级、访问授权、泄露风险等 6.成本 5.合规 硬件、软件、人力等 合法合规、按需用数等 我们的演进过程 我们的演进过程 模式1:人的驱动 模式4:AI驱动 分析师/策略师驱动 工程师驱动 由分析师或业务策略团队自己开发满足需求 由工程师团队承接业务需求 完全按需实现,所有指标预先聚合汇总成表,BI承担可视化功能 缺点: 缺点: •信息孤岛,割裂,重复建设•大量私有化业务逻辑,业务不一致•质量差,易出故障•维护成本高,难以管理长此以往,限制业务发展,积重难返 •静态报表,不支持下钻、切片•开发慢,需求积压•无法实现灵活探索分析 模式4:AI驱动 模式1:人的驱动 模式2:Cube驱动 语义是什么?说同一种语言:业务术语 统一术语,消歧去重 业务数据标准化 在贷余额 A部门叫「剩余本金」,B部门叫「期末余额」,C部门才叫「在贷余额」 逾期率 A部门算人头逾期率,B部门算订单逾期率,C部门算金额逾期率... 我们需要一个标准的「术语体系」来确保大家都在说同一种「语言」 为数据注入业务语言是语义化的核心工作! 指标是分析应用中抽象高级业务语义的具体表征,技术的复杂性完全藏匿于业务友好的语义表述之内 模式3:语义驱动 模式4:AI驱动 依托可信、易懂、高质的数据,深度运用机器学习与因果推断实现决策自动化 极多的语义,极高的智能,极限的自助,极致的敏捷向未来 THANKS感谢聆听