您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[DB-GPT]:DB-GPT在京东零售大数据平台的落地实践 - 发现报告
当前位置:首页/行业研究/报告详情/

DB-GPT在京东零售大数据平台的落地实践

信息技术2024-07-06程方银DB-GPT绿***
AI智能总结
查看更多
DB-GPT在京东零售大数据平台的落地实践

DB-GPT在京东零售大数据平台的落地实践 从传统数据应用到智能数据应用 程方银 DB-GPT核心开发者兼架构师 京东零售大数据平台智能化技术负责人 2024/07/06 Contents目录 01大模型能给大数据领域带来什么? 02大数据平台智能化落地案例 03生产部署实践 04总结 从传统数据应用走向智能数据应用 京东零售大数据平台的“三难” 大模型赋能数据开发链路 SQL开发基础流程及难点 目前只处理1w张高频表命中率:0.16 通过预处理构建索引例如: 业务域:3C数码业务主题:订单域 业务架构:京东零售 命中率:0.31 通过预处理构建索引例如: 业务域:3C数码业务主题:订单域 业务架构:京东零售 命中率:0.51 总体上与表基础信息召回相似:将字段信息拆分为chunk,通过索引+重排优化检索。 注意点: 1.chunk大小:一般不超过embedding模型上下文长度 2.chunk打标:附加表名、总长度和业务信息等 3.字段使用频率分组排序:解析加工任务SQL,提取字段热度 命中率:0.72 分层建设: DB-GPT基础设施、内部公共业务层、产品对接层 DB-GPT集群部署: 1.数据库(MySQL)作为模型元数据注册中心 2.ModelController/APIServer各部署3个节点 3.Webserver独立部署、至少3节点 4.内部工具基础设施多节点部署,至少3节点 5.基于Kubernetes部署 6.基于OTLP+Jaeger实现分布式可观测能力 总结 Data+AI三个方向: 1.数据开发/运维/治理的智能化 2.数据挖掘、洞察智能化 3.数据种类多样化,实现语音/视频等数据的理解和管理 智能体工作流(AgenticWorkflow)是落地最佳助手 1.将不确定的结果流程化、确定化 2.复杂问题分而治之 3.抽象很重要,通过工具化/算子化抽象对世界的理解 Thankyou!

你可能感兴趣

hot

8-1 点流采集系统在京东零售的实践

商贸零售
DataFunSummit2022:大数据存储架构峰会2022-07-19
hot

谭云志_基于LLM的智能数据分析平台在腾讯的落地实践

信息技术
DataFunSummit2024:数据产品在线峰会2024-12-06
hot

微信云原生大数据平台构建及落地实践-涂小刚

信息技术
ArchSummit上海2023|全球架构师峰会2023-06-06