热门搜索：

电商大模型及搜索应用实践

商贸零售2024-10-28翟周伟全球人工智能开发与应用大会爱***

AI智能总结

电商行业的发展和技术演进

电商行业发展：过去10年，实物商品网上零售额快速增长，电商模式从货架电商（如阿里、京东、拼多多）发展到内容电商（如抖音、快手、小红书）。这些模式都通过技术降低了商品流通成本，提高了零售效率。
电商场景分析：用户从需求产生到决策下单可分为购前、购中、购后三个阶段。其中，搜索是决策的关键环节，电商搜索技术主要解决商品分发效率问题，优化目标是GMV和UCVR。
关键问题和技术挑战：电商面临的产品形态、用户需求理解、多模态匹配等问题，需要通过更低的成本、更高的效率和更好的体验来解决。技术挑战包括文本+图像多模态匹配、动态价格、权衡UCVR和长期GMV等。

大模型在电商场景下的问题与解决方案

大模型的技术优势：广泛的知识总结和归纳能力、显著迁移学习和多任务能力、多语言多模态建模、强大的语言理解和生成能力。
电商场景下的应用问题：商品知识专业性不足、图像商品理解差、理解用户需求困难、新商品和促销更新慢、训练和推理成本高、安全性问题等。
电商大模型解决方案：NPU和GPU平台、文本大模型底座、多模态大模型底座、Prompt+Distillation等技术。

电商大模型关键技术

数据和预训练：站内外数据去噪、多阶段预训练、数据配比均衡策略。
通用对齐和领域对齐：通过SFT、DPO、PPO等方法实现通用指令和电商指令的对齐。
安全性：通过安全检测服务、文法规则引擎、分类模型、大模型安全检测等手段保障数据安全。

电商搜索场景下大模型应用实践

搜索交互：通过query引导提高搜索效率，解决歧义和个性化理解问题，提升用户体验。
电商用户意图理解：通过改进query理解和商品理解，提升搜索相关性和多样性。
文案创意生成：利用大模型生成商品标题和营销文案，提高营销转化效率。
电商搜索相关性：通过增强大模型和相关性对齐数据，优化搜索相关性。

下一代AI电商搜索

多模态大模型：通过多模态直接结果（语音+文本+视觉+空间），以大模型+Agent/AGI技术驱动，降低用户交互成本，提高搜索效率。

颜色规范

THANKS：智能未来，探索AI无限可能
Intelligent Future, Exploring the Boundless Possibilities of AI

电商大模型及搜索应用实践演讲人：翟周伟京东/技术总监 01电商行业的发展和技术演进 02 大模型在电商场景下的问题 CONT目E录NTS 03 电商大模型关键技术 04 电商搜索大模型应用实践 05 下一代AI电商搜索电商行业的发展和技术演进 •电商行业发展 •电商场景问题分析 •关键问题和技术挑战 •技术演进洞察电商行业发展过去10年实物商品网上零售额高速增长，电商模式也从货架电商为主发展为和内容电商并存的局面货架电商(阿里,京东,拼多多等)内容电商（抖音,快手,小红书等）本质上都是通过技术驱动大幅降低了商品流通成本，显著提升了零售效率，而电商模式的发展变化背后也是技术演进的结果电商场景分析从电商用户的消费决策链�发，用户从需求的产生到最终决策下单可拆解为购前，购中，购后，这三个阶段：购前购中购后购物需求搜索搜索用户非购物需求内容平台搜索推荐购物求即兴需需求激发电商平台物流售后内容平台：以抖音，快手，小红书等渗透为主的内容分发平台，也是当前的新兴内容电商平台，处于消费链路上游发展电商平台：以阿里，京东，拼多多为主的商品分发平台，也是当前的货架电商平台，处于消费链路中下游在消费决策链路中用户购买需求产生后搜索是决策的关键环节，而电商搜索的核心就是基于用户需求的商品分发，电商搜索技术就是主要解决商品分发效率的问题，优化的目标就是GMV和UCVR，和一般的信息搜索（如百度）有很大的区别。关键问题和技术挑战产品形态：京东主站三大搜索产品形态京东app京东小程序京东PC 宏观目标：更低的成本，更高的效率，更好的体验关键问题：GMV：UV*UCVR*客单价关键问题和技术挑战优化目标：GMV=UV*UCVR*客单价，多目标优化难题，还要坚持宏观目标：更低的成本，更高的效率，更好的体验，从技术角度拆解存在以下技术挑战：交互引流意图理解商品召回相关性 1.提升交互效率同时考虑激发用户需求 2.时效性问题 3.丰富性问题 1.复杂用户需求理解 2.数千数万商品属性和类目精准识别 3.用户画像等复杂上下文 1.多维度召回和融合 2.商品和库存等动态变化 3.个性化和多样性问题 1.文本+图像多模态匹配 2.动态价格,促销,物流等 3.权衡UCVR和长期GMV 4.宏观流量调控和反作弊电商搜索技术演进洞察技术演进本质上还是通过技术创新去实现更低的成本，更高的效率，更好的体验机器学习阶段文本检索阶段 1.规则引擎的应用 2.基础文本检索技术 3.关键词的人货匹配 1.统计NLP为核心的用户意图理解和商品理解2.基于ML的CTR/CVR建模 3.LTR排序模型 4.用户反馈数据学习深度学习阶段 1.基于DNN的意图/商品精准理解提升分发准确率2.以文本+语音+图像的新搜索交互, 3.ANN语义召回,多模态召回和DNN匹配技术 3.个性化搜索，千人千面大模型阶段 AGI导购助手 1.完全AGI技术驱动 2.完全多模态交互 2.AIAgent式购物服务 3.人格化数字虚拟助理 1.交互上单向引导到对话式交互导购 2.基于大模型的用户理解和商品理解解决长尾 3.大模型生成式检索技术大模型电商场景下的问题 •大模型的技术优势 •电商场景下的应用问题 •电商大模型解决方案大模型的技术优势 1 强大的语言理解和生成能力 2 广泛的知识总结和归纳能力 3 显著迁移学习和多任务能力 4 逻辑推理和分析能力 5 多语言多模态建模算法多模态，MOE 算力 GPU,NPU 数据 WebData,专有知识数据电商场景下的应用问题 •通用大模型商品知识专业性不足：商品类目,品牌,属性等 •通用知识和商品的对齐问题 •图像商品理解差电商知识理解 •直接应用没绝对效果优势 •理解购物历史，偏好，评论，商品细节等个性化挑战效果和个性化 •大模型本身更新很慢，知识陈旧 •新商品，促销，价格等更新时效性很高时效性 •训练和推理成本大，ROI低，很难大规模商用 •在线推理速度很难满足实时性成本和速度 •用户敏感数据泄露风险 •生成商品相关内容的安全合规安全性电商大模型 RAG 应用：Prompt+SFT/DPO/PPO等+Distillation 电商知识图谱 Web 搜索用户画像电商大模型解决方案京东App 京东PC 京东小程序 AlignmentLearningModelExpansion+多阶段ContinuePretraining 文本大模型底座(Dense+MOE) 多模态大模型底座 NPU平台 GPU平台电商大模型关键技术 •数据和预训练 •通用对齐和领域对齐 •安全性 •评估体系数据和预训练-DataPipline •核心：站外和站内商品相关数据去噪音，提升专有数据的电商知识密度数据通用征过滤用户行数据站内类类目过滤基于聚类和分重分析数据去评分器困惑度擎过滤文法引数据站外拒绝采样配比均衡策略安全性过滤质量评分器数据和预训练-ContinuePretraining 人类学习模式祖先/前辈知识积累教育系统个体学习新知识知识继承历史经验和智慧书本,文化,科技教师,家庭,社会获取知识研究和创新等下一代继承基于知识继承的增量学习框架 •基于对知识学习的认知，成本和效率的考量平台和框架 •基于NPU集群 •高效训练框架基座大模型 •100B •MOE 参数扩展 •DepthUp-Scaling •MOE 长上下文扩展 •增加长上下文数据配比 •分块缓存工程架构优化持续预训练 •CosineLearningRateScheduler •退火学习 •数据配比通用对齐和领域对齐学习目标：通用指令遵循优化，同时在电商领域增强对齐 •通用指令:一级数十， DPO•RewardModel: 二级数百类，数十万级 •电商指令:数十级，规模数万级 SFT •通用指令：数万级 •电商指令：数十万级 •电商反馈数据数百万千万级 PPO 安全性从潜在安全事件发生前后可以划分为被动安全和主动安全 •被动安全：安全检测服务，从检测方向，对用户输入的prompt和大模型生成的内容进行安全检测 •主动安全：大模型生成安全性，从生成方向，对于任何输入保证大模型生成的回复内容是安全可控的，包括 user 1 annotator 数据标注平台 prompt安全检检测测服务电商大模型 2 SFT+RLHF 生成内容检测安全攻击挖掘安全日志记录幻觉，毒性，偏见等，主要通过SFT和RLHF技术实现一级涉政恐暴色情赌博违禁品欺诈违法有害意识形态供应链漏洞安全性-被动安全目标：对用户输入的prompt和大模型生成的内容进行安全检测，输�安全分类标签，执行Action策略，除公司统一的安全审核服务外，同时构建了增强的被动安全审核。大模型安全检测分类模型拦截Action策略融合策略文法规则引擎安全干预平台 •安全干预平台:目标是快速干预实现紧急安全问题 •文法规则引擎:以句法分析模板+词典进行识别，侧重关键词特征明显的文本识别 •分类模型：以NN为核心的小模型，例如基于bert的分类，保证一定泛化，同时满足实时要求 •大模型安全检测：通过SFT等技术通过大模型来检测，为了满足低时延往往低于13B参数实现两种思路 •融合路线：通用对齐+电商对齐+安全对齐在SFT和DPO阶段数据融合，PPO阶段模型融合 •两阶段对齐：最后单独进行二阶段的安全对齐安全性-主动安全 •一级9类，二级100+类安全指令类型 DPO•:安全RW：基于被动安全检测审核数据训练一 •数据规模：数十万+ SFT •多个大模型辅助生成+ 人工编辑校验 •数据规模：数万级个安全性打分模型 •融合：和通用RW非线性融合 PPO 评估体系通用Benchmark •使用主流Benchmark： •MMLU,CMMLU,C-Eval,GSM8K，GAOKAO，SuperCLUE等电商Benchmark •和电商应用任务对齐构建了电商Benchmark •自动评估+人工评估安全性Score •CValues，Safety-Prompts，自建安全评估集 •Score=安全回复数量/总回复数量或总prompt数量 •FRR：错误拒答率电商搜索场景下大模型应用实践 •搜索交互 •电商用户意图理解 •文案创意生成 •电商搜索相关性搜索交互通过query引导，更好的获取满意结果，同时降低交互成本，提升搜索交互效率，通过引导有效提升转化，如下示意图：交互引导用户query 商品检索结果展现 skuList SKU 候选方向功能 Sug 基于前缀的补全提示纠错在用户提交了错误的查询词后进行纠正搜索发现基于搜索query和用户画像推荐相关query 我猜你搜等基于个性化的query推荐，激发购物需求难点和挑战 •传统方法核心是基于召回+排序思路，SMT,NMT，优化链路长，噪音大 •歧义，多义，个性化等理解挑战 •准确性，泛化效果很难进一步提升搜索交互-以纠错/Sug等为例大模型应用核心点 •基于电商知识增强的电商大模型进一步结合业务任务对齐 •搜索交互日志利用+对齐优化目标需考虑对搜索效果的增益循环迭代小流量应用 RLHF阶段 •小流量验证，观察UCTR等 •收集反馈数据 •基于小流量用户SKU点击构建偏序数据 •RW基于商品检索系统收益指导 •MultiInstructionLearning 电商大模型 SFT对齐阶段 •Rejectionsampling •MultiTask 电商意图理解电商意图理解目标：解决用户需求表达和商品的语义对齐问题，提升商品召回的相关性和多样性，最终提升用户转化UCVR 方向： •query理解：分词，实体识别，类目预测，品牌识别，改写，需求识别等 •商品理解：商品SKU理解，商品图像理解，sku-to-query等用户需求 query理解商品检索商品理解商品空间问题和挑战： •query理解:传统基于规则+基于bert的二分类或多分类,序列标注等算法,优化成本高,长尾难解决 •商品理解：商品理解泛化差，商品图像基于OCR准确率不高电商意图理解核心技术： •Instructionlearning •搜索用户反馈用于DPO/PPO •RAG：知识图谱-RAG，用户画像-RAG 搜索反馈 prompt应用 RAG RLHF：基于搜索反馈+CTR/CVR的RW InstructionSFT 电商大模型电商知识图谱用户画像实体识别类目预测......意图预测商品理解. 卖点生成等 •SKU商详->卖点 •SKU商详+卖点->卖点文案多模态大模型文案创意生成商品标题生成 •SKU描述->标题 •SKU描述+SKU图像->标题商品文案生成 •SKU描述+场景->营销文案 •SKU描述+SKU图像->图文文案图文对比学习图像编码器文本编码器图像输入文本输入图文匹配学习融合编码器图像输入文本输入目标：利用大模型的生成能力，降低商品素材的成本，提升营销转化效率典型场景关键技术 •图文语义对齐学习 •商品图文数据构建电商搜索相关性 •核心问题：用户需求和商品的匹配问题，最终会被转化为sim(query,sku)的相关性,同时优化考虑CRT和CVR为目标 •主流模型：主流的基于NN的语义相关性模型分为两大类：孪生网络和交互式匹配孪生网络也称双塔模型，特点：

点击免费查看完整报告