现代数据栈中的消费层BI+AI产品的演进
1. 什么是现代数据栈
-
传统数据栈问题:
- 性能受限,成本高昂
- 使用门槛高
- 获取洞察流程长
- 场景扩展困难
-
数据仓库的发展:
- 商业:数据作为企业竞争力的核心,赋能组织做更好的决策
- 技术:大数据、云原生、AI浪潮的兴起
- 1990年代:数仓,OLTP到MPP
- 2010年代:数据湖,Hadoop
- 2016~:云数仓,Lakehouse
-
现代数据栈的起源:拆分
-
现代数据“栈”:
-
发展趋势:
- 以业务为中心
- 拥抱云原生
- 模块化产品,插拔即用
- DataOps成为“第一公民”
2. 现代数据栈中的自助分析
-
传统数据分析流程:
-
传统数据分析痛点:
- 技术:数据处理执行速度慢,可扩展性差
- 流程:门槛高,依赖IT团队的开发实施
- 产品:BI层需要大量额外工作,如查询优化、缓存、二次计算、Cube...
- 落地:应用场景少,难以流畅完成决策闭环
-
现代数据分析流程:
-
现代数据分析产品趋势:
- 基础能力:融入现代数据栈,基于云原生架构
- 让业务用起来:数据分析作为软件产品,以业务为中心
- 让业务信任数据:分析资产管控与优化
- 完成决策闭环:从分析为主到数据驱动决策全流程支持
3. Analytics as Software
- 发挥数据价值:我们收集这么多数据,最终目标是什么?
- 用户体验+决策流程:从被动响应需求的服务部分,到主动规划,基于数据OS打造“数据产品”
- 数据产品的典型用户:
- 软件工程的“入侵”:
- 瀑布式开发 vs. 敏捷开发
- API-first设计,开放,可组合性
- GUI操作 vs. 代码开发
- 软件包复用,插件化架构,数据应用市场
- 代码 vs. 低代码:
- 面向开发者用户:
- 代码 vs. 低代码
- 自然语言与打手势,用户门槛与灵活性的取舍
- 软件工程实践,版本控制,code review,自动化测试等
- 代码与低代码的结合
4. 增强分析与决策智能
- 数据分析渗透率:
- 数据洞察推荐
- 数据故事生成
- 分析成熟度进阶
- 决策智能:分析能力 + 自动化
- 增强分析的产品能力要求:
- 模型开发能力,no-codeto full-code
- 模型解释能力
- 模型运维(MLOps)
- 仿真与优化
- 因果推理
- 实时数据分析
- 开放API
- Reverse ETL
观远数据的实践
- 云原生,云巡检
- 多用户角色支持,BI+AI,no-codeto full-code
- 数据应用市场
- 开放API,自定义可视化,业务系统集成
- 增强分析,决策建议
- 数据管控,数据质量,数据安全
以上为现代数据栈中消费层BI+AI产品的演进总结。