1688AI助手“源宝”的成长之路 程亦曲1688产品专家 DataFunSummit#2024 为什么要做电商买家的AI助手? 做什么样的AI采购助手? MVP版本:模型能力约束下的应对 2.0版本:转向数据驱动的agent设计未来畅想 01 为什么要做电商买家的AI助手? •AI在电商行业的应用 •为1688买家带来哪些新可能 现有应用主要集中在服务卖家和平台提效,针对买家创造新产品能力的很少 外投 智能素材 渠道投放 用户运营 导购 搜索改写 条件推荐智能主题 趋势清单 自助下单数字人直播营销托管 营销 商家助手客服托管知识检索采购建议 询盘 智能发品商品讲解品类规划经营助手系统同步 商家工具 智能外呼销售助手流量托管 销售后台 不同B买的关注点差异大|信息密度高|决策链条长→买家使用效率低 需求产生 (站外/线下) 导购发现 (平台) 挑选决策 (平台/线下) 下单成交 (平台/线下) 下单 市场热度 金融服务 服务保障 代发服务 …… …… …… 履约能力 店铺资质 …… 售后 价格 会场 履约 销量 推荐 定制服务 买家评价 商品规格 搜索 私域 行业资讯 内容平台 买家需求 匹配 决策 平台供给 NOW •直接:搜索词/旺旺消息 •间接:浏览/收藏/加购等行为数据 •平台:搜索/推荐/… •用户:浏览/询盘/… •结构化:商品标题、属性、价格、服务保障、好评率… AI的优势 •对话交互,挖掘并理解买 家需求 •AI做分析和决策建议 •非结构化:商品详情图文、买家评价、店铺介绍…… 在现有用户动线上,AI帮助获取与处理信息、提高采购决策效率 买家的“AI采购助手” 02 做什么样的AI采购助手? •功能怎么切? •交互怎么切? 在在现现有有用用户户动动线线上上,,AAII帮帮助助买买家家获获取取与与处处理理信信息息,,提提高高采采购购决决策策效效率率 ①首页搜索 商品详情页购物车 ②③ 总结了解商品详情 分析查看买家评价 分类对比多款商品 润色算实价、比价格 创作对比店铺 找相关商品 在在现现有有用用户户动动线线上上,,AAII帮帮助助买买家家获获取取与与处处理理信信息息,,提提高高采采购购决决策策效效率率 ①首页搜索 商品详情页购物车 ②③ 总结了解商品详情 分析查看买家评价 分类对比多款商品 润色算实价、比价格 创作对比店铺 找相关商品 单点嵌入 弱侵入、易上手 独立对话页 冷启低成本、迭代空间大 Agent指令 弱侵入;功能灵活度大 用户对AI助手弱感知 打断动线;需要用户教育 改造成本高 Agent1 用户输入 意图路由 ReAct+Parser •Question:xxxThought:xxx •Action:xxx •Observation:xxx Agent2 Agent3 输�结果 工具库 知识库 词搜、图搜等电商专有工具库 商品/商家/商机等电商专有知识库 03 MVP版本: 模型能力约束下的应对 Qwen7B Qwen72B Qwen1.5系列 2023.091011122024.0102 预研与立项 1.0版本启动开发 1.0产品设计 以“商品对比”Agent为例 内容重复 服务优势是“满300-30”,价格优势是“满300-30” 逻辑错误 “商品1的发货速度更快,因为商品1承诺48小时发货,商品仅支持24小时发货” 前后矛盾 “我更推荐商品1商品2的回头率更高,表明卖家对商品2更认可” 格式输出不稳定 分点输出/markdown格式/长度等不稳定 PS:为什么不做SFT和对齐?1.训练后仍不够稳定、无法彻底解决问题2.资源成本和迭代灵活度 Human:想象你是一名来自1688平台的专业商品鉴定师,先根据商品信息选择你更推荐哪款商品,再从 “服务/优惠/质量”三个维度列�你推荐的商品的优势。 回答时需要遵循以下用---括起来的格式: --- [analyze] 基于上面的分析和其它指标的考察,我更推荐商品...,这款商品有以下优势: **服务**\n 1.xxx\n **优惠**\n 1.xxx\n **质量**\n 1.xxx\n 以上信息由1688-AI助手生成,仅供参考。 --- \n\n下面是商品信息说明: 商品1\n[terms0]商品2\n[terms1] \n\nAssistant:[analyze] += 1.0版本上线效果示意 04 2.0版本: 转向数据驱动的AI产品设计 核心决策:切换到Qwen1.572B、模型能力显著提升-P1 输出下限有保障的前提下,关注点转向如何提升质量上限 内容重复 没有足够参考信息 逻辑错误 不了解业务概念 前后矛盾 缺少电商行业知识 格式输出不稳定 不了解用户偏好 数据验证 需要优化 符合预期 实际验证!实际验证!实际验证! 数据使用 过滤/后处理 RAG Tools 已有格式未必适合LLM使用 数据质量 时效性 完整性 准确性 覆盖度 挖掘数据源2 已有数据源2 抛开质量谈丰富度是耍流氓 已有数据源1 数据丰富度 已有数据源3 挖掘数据源1 识别关键数据源 方案 迭代 需求 分析 理想效果 定义 AI可解 /可行? 数据 验证 技术 开发 •用户想要什么? •用户会怎么表达需要? •原先没做的根因是什么? •模型能力够吗? •有对应数据吗? •数据质量足够吗? •缺少的数据可以生产吗? •可以规模化吗? •好用的工具使效率加倍 •Promptengineering •关注批量化的结果而不是goodcase 引入更多数据,从规则对比→llm自主决策,提升决策灵活度和智能感 <用户身份>经营实体店的店主</用户身份> <用户诉求>来电商平台进行商品采购进行经营,目前看到2款商品,不知道如何决定,你帮我分 析一下</用户诉求> <商品1>$$1</商品1> <商品2>$$2</商品2> <要求>输出内容必须以json格式输出,除json内容外,无其他输出</要求> <输出格式>```json[ "得分":["商品1":"","商品2",""], "AI对比分析":"商品1和商品2xxxxx", "AI结论":"商品xxxx(商品1或者商品2,只能2选1)更推荐入手", "AI推荐理由":"xxx", "胜出商品":"商品1或者商品2", "商品1":["卖点":"xxx","短标题":"XXX","价格&优惠":"xxxx","风格特点":"xxxx","商品品质":"xxxx","店铺实力":"xxxx","服务特色":"xxxx"], "商品2":["卖点":"xxx","短标题":"XXX","价格&优惠":"xxxx","风格特点":"xxxx","商品品质 ":"xxxx","店铺实力":"xxxx","服务特色":"xxxx"] ]```</输出格式> <输出要求>[ "AI对比分析":"无" "AI结论":"无", "AI推荐理由":"无", "胜出商品":"只能写商品1或者商品2" "商品1":["卖点":"8个字以内,不要有任何的标点符号","短标题":"8个字以内","价格":"无","风格特 点":"无","商品品质":"无","店铺实力":"无","服务特色":"全面"], "商品2":["卖点":"8个字以内,不要有任何的标点符号","短标题":"8个字以内","价格":"无","风格特 点":"无","商品品质":"无","店铺实力":"无","服务特色":"全面"] ]</输出要求> 构建完善的商品知识库(10+指标),根据人群偏好生成差异化采购建议 商品知识库 用户需求图谱 人群差异化的采购建议 += 一级人群(B/C) 二级人群年龄性别 主采类目决策偏好历史动线 …… 自研模型从商品详情图中提取高质量商品信息、用于RAG显著提升用户query可满足度 商详原图 传统OCR自研 自研模型从商品详情图中挖掘商品信息、用于RAG显著提升用户query可满足度 引入下游商机榜单数据源,LLM洞察爆品趋势、给出生意建议 05 未来畅想 •LLM的应用壁垒最终仍是数据 •对话交互并不是终局形态 •一个彩蛋 1688AI深度找 小范围内测中 •使用链路更短、使用门槛更低 •找的更精准、更符合B类买家的需求 •匹配逻辑更清晰、结果可解释 欢迎下载1688App,体验AI采购助手“源宝”! DataFunSummit#2024 THANKS DataFunSummit#2024