Agent开发实战与分发模式创新 演讲人:马根明 目录 01 引言 02 Agent开发实战 03 分发模式创新 04 安全与隐私保护 05 总结与展望 0引言 Agent(智能体)是什么 深度思考 日历 思维链 自检子目标拆 解 计算器 代码解释器 搜索 ··· 短期记忆 长期记忆 智能体是一种在大语言模型基础上 构建的智能实体,拥有自主思考和行动的能力。 智能体就像一个聪明的助手,能够深度理解你的需求,甚至拆分子任务,并调用各种工具扩展自身能力,从而完成你的各种具体指令。 自主性 无需人工干预,具备自主探索和决策能力 反应性 先思考后行动,能快速应对环境中的变化和刺激 主动性 不止于应对环境变化,能推理、计划和行动,来实现特定目标 社交能力 可以与其他智能体(包括人类)进行交互 Action执行 Planning Agent Tools 推理规划 智能体 工具 Memory记忆 Agent和LLM(大模型)的区别在于,大模型与人类之间的交互是基于prompt实现的,用户prompt是否清晰明确会影响大模型回答的效果。而Agent的工作仅需给定一个目标,它就能够针对目标独立思考并做出行动。 帮我做一个去上海玩的攻略 这周末吧 智能体是如何运行的 请问您计划去多久,和谁一起 智能体常见场景 【互动游戏】庆余年密室逃脱 【文创】悟智智文助手 【生活助手】爸妈防骗助手 【人物角色】苏轼 【学习】读书专家 AI的发展给各行各业带来巨大的机遇和挑战 【提效工具】TreeMind树图 【领域专家】农民院士智能体 【图创】创客贴海报设计助手 Agent开发实0战2(文心智能体) 文心智能体平台AgentBuilder 是基于文心大模型的智能体构建平台,提供自然语言创建智能体的开发新范式。 支持广大开发者根据自身行业领域、应用场景,采用多样化的能力、工具,打造大模型时代的智能体。 并为开发者提供百度生态+域外分发路径和多元的商业机会,助力开发者完成商业闭环,是“开发+分发+运营+变现”一站式智能体赋能平台。 开发 难度低 调优 迭代快 分发 渠道广 商业 可闭环官网:agents.baidu.com 模型 基础设施 百度公有云 文心大模型:EB3.5/4/speed等文心系列模型 内容风控中台 基础业务服务 (帐号,交易等) EmbeddingSDK 向量数据库 idata/ievalue 开发工具 大模型中台 GDPSDK 业务 功能 文心智能体整体架构图 开发能力 经营/运营能力 入驻管理 Agent(智能体)开发(AssistantAPIols) 上下文,知识增强,to Tools(原plugins) 分发管理 数据分析 调优 站内信消息 核心服务 调试与测试 测试集管理 调试标记 协议规范标准 协议解析 组件库 布局系统 设计系统 宿主通信 一站式服务托管 基于LUI进行全流程开发 运行接入 部署 发布 代码生成 SDK/OpenAPI LLM云服生态 API务服务 多语言/跨平台 LUI交互操作服务 Function服务API Call召回管理 调式与日志服务 可视化开发 开发调式 画布预览 应用三方 部署组件 Prompt管理 版本调式 管理能力 推荐智能 生成优化 知识库管理 文件段落 解析分割 向量向量 加工检索 质量与安全 全链路监控 巡检能力 机审 能力 风控能力 效果评估 全流程trace 基础能力 文心智能体设计范式 Zero-shotReActPlanReAct 任务描述 Zeroshot Prompt 记忆 文心一言 工具 观测 对话 任务描述 Fewshot Prompt Think 记忆 文心一言思考 工具 观测 对话 任务描述 Plan PromptPrompt PlanFewshot Think 思考 记忆 文心一言 规划 工具 观测 对话 一切都是工具 Queryindexing LLMPlan Retrieval Code-interpreter LLM Generate 工具 RetrievalLLM 检索增强 File Parser LLM 文件对话 基于工具的任务规划 开发新范式:“一句话”开发智能体 输入你的idea 要做一个什么设定的角色,或想要解决什么问题 多尺寸模型 模板复制 数据库 知识库 官方插件 商业链接 数字形象 长期记忆 生成你的智能体 平台能力支撑自动生成设定、勾选配置,快捷创建智能体 你的智能体 智能体 诊断 调优 分发 用户动作反馈正负向case分析能力拓展模型升级 创建 Prompt优化知识库优化工具集优化 开发者根据诊断建议进行调优 冷启 分发冷启动界定能力范围效果评估反馈 调优迭代快:可成长的智能体 GU 交互 支持文、图、表、视频的动态化渲染 新加坡文旅智能体案例 分发0模3式创新 分发渠道广:全域智能分发 搜索精准寻址 自然结果满足 AI助手微信小度(含旗下添添系列) Agent分发中的问题 Query 精准匹配:将Query调度到最优Agent Agent调度 Agent理解 Agent评估 深度刻画:准确刻画Agent的能力 筛选优化:评估促进Agent进化 Agent评估 传统模型评估 TrainData EvalData ProdTestData 好的评估机制 •与产品的相关性高 •可解释性好 •成本低、速度快 问题:训练数据的分布不可知,产品与训练数据分布差异较大 人工评估 评估集 人工评估 聚合打分 问题:评估集异常庞大、成本高、速度慢 Agent评估 前向: •LLM泛化评估集 •LLM自动评估 •人工评估校验 LLM-EvalHuman-Eval Auto-EvalUser-Feedback 后向: •用户反馈信号 •自动评估 •开发者优化 评估效果、成本和速度的平衡 Agent理解 AgentData 流式理解 语义多表征 网页理解Agent理解 时效性 质量权威性 链接分析 内容理解 问题: •Agent内容是动态生成 •Agent的能力边界模糊 •Agent可进化/退化 通过多维表征来刻画Agent能力 Agent调度 需求理解 需求识别 泛化理解 检索 调度 Agent 调度 Agent 1 Agent 2 Agent 3 Agent 排序 Agent 召回 多表征语义索引 创建步骤 1.设定智能体能力边界 •边界清晰、功能明确 •能力重点突出 •设定评估集合 2.根据功能边界拆分能力点 •私有数据、私有工具 •共享工具能力 3.完成能力点 4.创建智能体、初版调优 5.评估智能体效果 •根据评估集合 6.拆分case •分析case问题,并定位 7.⑥→② 8.发布后持续运营 插件 1.景点查询 2.攻略查询 3.休闲娱POI点查询 4.酒店查询 5.城市景点榜单查询 知识库 1.所有文旅公众号内容 2.官方政策类信息 如何打造一个好的智能体 新加坡旅游局智能体 创建知识库 插件 工作流延展智能体边界 文旅分发全流程 跨平台兼容性与标准化问题 多端创建、多端分发:文心智能体平台和三方智能体作为智能体生产端,采取统一协议,分别供给搜索 和第三方进行智能体分发。 一体多端方案 垂类/其他 文小言 千帆 Appbuidler 巧舱 三方智能体 落地页嵌入 接入服务 对话API 入驻API 智能体生产 经营 审核 调优 创建 搜索分发 输出智能体端/H5 文小言 星河社区 一言web 嵌入交互SDK 小度 输出API 智能体分发服务 AgentProxy 分发服务 3个API和2个SDK 监听SDK 华为三星 输出智能体H5 •入驻API:统一Agent的Meta信息,抹平创建端差异 •输出API:将可分发的Agent输出给多个分发渠道 •对话API:通过统一的对话协议,调起多端创建的Agent •交互SDK:提供默认兜底的Agent交互效果 •监听SDK:非平台Agent落地页上传对话信息用以优化分发效果 安全0与隐4私保护 大模型的数据安全与隐私保护 数据安全问题、AI的可信度问题、隐私保护问题等等,都在冲撞着当前的数据治理格局。 越狱 2023年3月,韩国三星电子员工因违规使用ChatGPT,在短短20天内便发生了三起半导体机密资料外泄事件。 2023年6月,美国科技新闻网站CNET被发现使用人工智能软件生成了70多篇文章,其中包含严重的事实错误。 2023年10月,科大讯飞AI学习机因内容审核不严格导致不当内容被用于数据训练,引发舆情事件,致使市值蒸发120亿。 2024年8月,360儿童手表答疑时出现争议言论。 大模型内容监管政策要求 “提供深度合成服务,应当遵守法律法规,尊重社会公德和伦理道德,坚持正确政治方向、舆论导向、价值取向,促进深度合成服务向上向善。 具有舆论属性或者社会动员能力的深度合成服务提供者,应当按照《互联网信息服务算法推荐管理规定》履行备案和变更、注销备案手续。深度合成服务技术支持者应当参照前款规定履行备案和变更、注销备案手续。” “坚持社会主义核心价值观,不得生成煽动颠覆国家政权、推翻社会主义制度,危害国家安全和利益、损害国家形象,煽动分裂国家、破坏国家统一和社会稳定,宣扬恐怖主义、极端主义,宣扬民族仇恨、民族歧视,暴力、淫秽色情,以及虚假有害信息等法律、行政法规禁止的内容。 具有舆论属性或者社会动员能力的生成式人工智能服务的,应当开展安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案 国内首个生成式AI安全指导性文件,百度安全深入参与要点内容编写要点给出了生成式人工智能服务在安全方面的基本要求,包括语料安全模型安全、安全措施、安全评估等,并明确了违反社会主义核心价值观的内容、歧视性内容、商业违法违规、侵犯他人合法权益等在内的大类3种风险;每一个大模型企业的生成式AI产品若想要“持 证上岗”,需逐条核对是否符合这份文件中的要求。 《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》《生成式人工智能服务安全基本要点》 LM应用面临的安全挑战 围绕企业的前置业务环节容易出现各类安全风险:如账号风险、业务风险。 针对“提问内容”存在的安全挑战:用户输入的prompt也能存在各类违法违规内容风险,主要包括黄赌毒、涉政敏感、恶意代码等。另外用户输入的prompt属于提示注入攻击(目标劫持注入/提示泄露/越狱攻击等),近期对大模型产生较大影响的新型漏洞,特别是对于那些采用提示学习方法的模型而言。注入恶意指令的提示可以通过操纵模型的正常输出过程以导致大语言模型产生不适当、有偏见或有害的输出。 针对“输出内容”存在的安全挑战:围绕大模型生成内容,具有一定的随机、不可控的情况,容易出现违规内容、歧视偏见、隐私泄漏、内容侵权等诸多风险。 请求 风险 正常返回 服务返回内容 用户提问内容 问题 安全Prompt 文心大模型 返回内容 风险 多模态 内容生成 视频 音频 图片 文本 违规内容检测 网址安全检测 代码注入检测 Prompt风险提示 提示词注入攻击 数据安全 虚假信息防范 解决方案 LM应用面临的安全挑战 百度大模型安全合规防护体系 Prompt审核/改写/代答AI生成内容安全过滤 多轮指Prompt红线知红线大检索多语种代改写内容审核识库模型增强安全大模型安全引擎 模型管理策略管理词库管理自动定义知 识库 【TC260】五大类31中风险:涉黄/涉赌/涉毒/涉政/涉军/涉恐/涉暴/辱骂恶意代码/虚假信息/反社会价值观/内容侵权/偏见/歧视/隐私泄漏 隐私问题 记忆隐私泄露:在学习的过程中,除了提取的语言知识之