行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

百度文心智能体开发实战与分发模式创新

2024-11-22 马根明全球软件开发大会光影

Agent开发实战与展望

引言

智能体（Agent）是一种基于大语言模型构建的智能实体，具备自主思考、行动和交互能力。与LLM（大模型）通过prompt交互不同，Agent仅需目标即可独立思考和行动，实现主动性、反应性和社交能力。

Agent运行机制与场景

智能体通过自主探索、工具调用和目标实现来运行，常见应用场景包括文创助手、生活助手、互动游戏、学习工具、提效工具、领域专家和图创助手等。

Agent开发实战（文心智能体）

文心智能体平台AgentBuilder是基于文心大模型的智能体构建平台，提供自然语言创建智能体的开发范式，支持开发者根据行业领域和应用场景打造智能体，并提供百度生态+域外分发路径和多元商业机会。

文心智能体设计范式

开发新范式：“一句话”开发智能体
输入idea，平台自动生成设定、勾选配置，快捷创建智能体。
调优迭代快：可成长的智能体
支持LGUI交互，动态化渲染文、图、表、视频。

新加坡文旅智能体案例

通过创建知识库、插件和工作流延展智能体边界，实现跨平台兼容性和标准化分发。

分发模式创新

分发渠道广：全域智能分发

通过小度等渠道进行全域智能分发，解决跨平台兼容性和标准化问题。

Agent评估

前向评估：包括Agent理解、网页理解、质量权威性、链接分析和内容理解等。
评估挑战：训练数据分布不可知、产品与训练数据分布差异大、评估集庞大且成本高。
解决方案：确保与产品相关性高、可解释性好、成本低、速度快。

文旅分发全流程

创建步骤包括设定能力边界、拆分能力点、完成能力点、创建智能体、初版调优、评估效果、拆分case、分析问题并定位、持续运营。

安全与隐私保护

大模型的数据安全与隐私保护

数据安全挑战：账号风险、业务风险、提示注入攻击、内容违规、歧视偏见、隐私泄漏、内容侵权等。
隐私问题：记忆隐私泄露、系统隐私泄露、上下文隐私泄露。
解决方案：遵守相关法律法规和伦理道德，开展安全评估，履行算法备案。

大模型内容监管政策要求

《生成式人工智能服务安全基本要点》：明确语料安全、模型安全、安全措施、安全评估等要求，以及5大类31种风险。
《互联网信息服务深度合成管理规定》：对深度合成服务提供者和技术支持者进行备案管理。
《生成式人工智能服务管理暂行办法》：规范生成式人工智能服务管理。

总结与展望

总结

介绍了Agent的发展和开发范式，目前仍处于发展阶段，离理想模型尚有距离。文心智能体平台支撑Agent研发和分发。

展望

应用场景：依托智能体的环境感知与交互、自主规划和行动能力，结合多模态+UI交互，有望开拓更丰富的应用场景。
技术发展：多模态大模型是端侧Agent落地的基石，未来模型层和应用层竞争可能加剧。
平台发展：未来需降低研发门槛、提升效果，提供更多Agent范式和优化手段。

演讲人：马根明目录 02Agent开发实战 01引言 03分发模式创新 04安全与隐私保护 05 Agent(智能体)是什么智能体是一种在大语言模型基础上构建的智能实体，拥有自主思考和行动的能力。智能体就像一个聪明的助手，能够深度理解你的需求，甚至拆分子任务，并调用各种工具扩展自身能力，从而完成你的各种具体指令。自主性无需人工干预，具备自主探索和决策能力反应性先思考后行动，能快速应对环境中的变化和刺激 Agent和LLM（大模型）的区别在于，大模型与人类之间的交互是基于prompt实现的，用户prompt是否清晰明确会影响大模型回答的效果。而Agent的工作仅需给定一个目标，它就能够针对目标独立思考并做出行动。主动性不止于应对环境变化，能推理、计划和行动，来实现特定目标社交能力可以与其他智能体（包括人类）进行交互智能体是如何运行的智能体常见场景【文创】悟智智文助手【生活助手】爸妈防骗助手【互动游戏】庆余年密室逃脱【学习】读书专家 AI的发展给各行各业带来巨大的机遇和挑战【提效工具】TreeMind树图【领域专家】农民院士智能体【图创】创客贴海报设计助手 02Agent开发实战（文心智能体）文心智能体平台AgentBuilder 是基于文心大模型的智能体构建平台，提供自然语言创建智能体的开发新范式。支持广大开发者根据自身行业领域、应用场景，采用多样化的能力、工具，打造大模型时代的智能体。并为开发者提供百度生态+域外分发路径和多元的商业机会，助力开发者完成商业闭环，是“开发+分发+运营+变现”一站式智能体赋能平台。文心智能体设计范式一切都是工具开发新范式：“一句话”开发智能体输入你的idea 生成你的智能体平台能力支撑自动生成设定、勾选配置，快捷创建智能体要做一个什么设定的角色，或想要解决什么问题你的智能体调优迭代快：可成长的智能体 LGUI交互支持文、图、表、视频的动态化渲染新加坡文旅智能体案例 03分发模式创新分发渠道广：全域智能分发小度（含旗下添添系列） AI助手 Agent分发中的问题精准匹配：将Query调度到最优Agent 深度刻画：准确刻画Agent的能力筛选优化：评估促进Agent进化 Agent评估好的评估机制问题：训练数据的分布不可知，产品与训练数据分布差异较大 •与产品的相关性高•可解释性好•成本低、速度快问题：评估集异常庞大、成本高、速度慢 Agent评估前向： Agent理解网页理解 Agent理解质量权威性链接分析内容理解 •Agent内容是动态生成•Agent的能力边界模糊•Agent可进化/退化如何打造一个好的智能体-新加坡旅游局智能体创建步骤知识库 1.设定智能体能力边界•边界清晰、功能明确 •能力重点突出•设定评估集合2.根据功能边界拆分能力点•私有数据、私有工具•共享工具能力3.完成能力点4.创建智能体、初版调优5.评估智能体效果•根据评估集合6.拆分case•分析case问题，并定位7.⑥→②8.发布后持续运营 1.所有文旅公众号内容2.官方政策类信息插件 1.景点查询2.攻略查询3.休闲娱POI点查询4.酒店查询5.城市景点榜单查询创建知识库、插件、工作流延展智能体边界文旅分发全流程跨平台兼容性与标准化问题多端创建、多端分发：文心智能体平台和三方智能体作为智能体生产端，采取统一协议，分别供给搜索和第三方进行智能体分发。 04安全与隐私保护大模型的数据安全与隐私保护数据安全问题、AI的可信度问题、隐私保护问题等等，都在冲撞着当前的数据治理格局。 2023年3月，韩国三星电子员工因违规使用ChatGPT，在短短20天内便发生了三起半导体机密资料外泄事件。2023年6月，美国科技新闻网站CNET被发现使用人工智能软件生成了70多篇文章，其中包含严重的事实错误。2023年10月，科大讯飞AI学习机因内容审核不严格导致不当内容被用于数据训练，引发舆情事件，致使市值蒸发120亿。2024年8月，360儿童手表答疑时出现争议言论。大模型内容监管政策要求 “坚持社会主义核心价值观，不得生成煽动颠覆国家政权、推翻社会主义制度，危害国家安全和利益、损害国家形象，煽动分裂国家、破坏国家统一和社会稳定，宣扬恐怖主义、极端主义，宣扬民族仇恨、民族歧视，暴力、淫秽色情，以及虚假有害信息等法律、行政法规禁止的内容。具有舆论属性或者社会动员能力的生成式人工智能服务的，应当开展安全评估，并按照《互联网信息服务算法推荐管理规定》履行算法备案 “提供深度合成服务，应当遵守法律法规，尊重社会公德和伦理道德，坚持正确政治方向、舆论导向、价值取向，促进深度合成服务向上向善。国内首个生成式AI安全指导性文件，百度安全深入参与《要点》内容编写《要点》给出了生成式人工智能服务在安全方面的基本要求，包括语料安全、模型安全、安全措施、安全评估等，并明确了违反社会主义核心价值观的内容、歧视性内容、商业违法违规、侵犯他人合法权益等在内的5大类31种风险；每一个大模型企业的生成式AI产品若想要“持证上岗”，需逐条核对是否符合这份文件中的要求。具有舆论属性或者社会动员能力的深度合成服务提供者，应当按照《互联网信息服务算法推荐管理规定》履行备案和变更、注销备案手续。深度合成服务技术支持者应当参照前款规定履行备案和变更、注销备案手续。” 《生成式人工智能服务安全基本要点》《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》 LLM应用面临的安全挑战围绕企业的前置业务环节容易出现各类安全风险：如账号风险、业务风险。针对“提问内容”存在的安全挑战：用户输入的prompt也能存在各类违法违规内容风险，主要包括黄赌毒、涉政敏感、恶意代码等。另外用户输入的prompt属于提示注入攻击（目标劫持注入/提示泄露/越狱攻击等），近期对大模型产生较大影响的新型漏洞，特别是对于那些采用提示学习方法的模型而言。注入恶意指令的提示可以通过操纵模型的正常输出过程以导致大语言模型产生不适当、有偏见或有害的输出。针对“输出内容”存在的安全挑战：围绕大模型生成内容，具有一定的随机、不可控的情况，容易出现违规内容、歧视偏见、隐私泄漏、内容侵权等诸多风险。记忆隐私泄露：在学习的过程中,除了提取的语言知识之外，模型无可避免的会记住一些数据。从而返回了他人的隐私信息。如右图：隐私问题系统隐私泄露：大家熟知的“骗取GPTs的System Prompt”就是系统隐私泄漏的一种。上下文隐私泄露：上下文隐私泄漏，会暴露根据记忆暴露用户信息。隐私保护–解决方案 05总结与展望总结介绍了Agent的发展和开发范式，目前已经实现了很多应用，但是还是在发展阶段，离理想的Agent模型，还有不小的距离。文心智能体平台：支撑Agent研发、分发的开发者平台展望 •依托智能体（AIAgent）的环境感知与交互、自主规划和行动等能力，兼具工具和情感属性的特点，尤其是在多模态+UI交互的加持下，有望开拓出更丰富甚至全新的应用场景。 •Google智能眼镜也对其支持，意味着未来脱离手机和电脑使用AI Agent成为可能。 •面向智能交互的多模态大模型是端侧Agent落地的基石，近期海内外科技巨头和AI初创公司陆续推出UI识别和操作模型、类Agent产品，未来模型层和应用层的行业竞争可能会进一步加剧。展望从平台的角度来看，未来从研发和分发上还有很多事情要做。分发研发 •降门槛、提效果•提供更多Agent范式•提供更多元优化手段 THANKS 大模型正在重新定义软件Large Language Model Is RedefiningThe Software

点击免费查看完整报告

百度文心智能体开发实战与分发模式创新

Agent开发实战与展望

引言

Agent运行机制与场景

Agent开发实战（文心智能体）

文心智能体设计范式

新加坡文旅智能体案例

分发模式创新

分发渠道广：全域智能分发

Agent评估

文旅分发全流程

安全与隐私保护

大模型的数据安全与隐私保护

大模型内容监管政策要求

总结与展望

总结

展望

你可能感兴趣

百度高级认证-“AIGC共拓计划”创新营销方法与实战

用LangChain DeepAgents开发高级AI智能体实战手册

百度发布文心大模型4.0，超讯通信签署六方战略合作协议

文心大模型加速迭代，百度云价值进一步显现

华西计算机每日资讯0218百度文心大模型日均调用量达165亿将

百度(09888)文心千帆应用场景解读-港股-调研纪要

传媒互联网周报：百度文心新模型登顶 Hugging Face，《731》前三日票房近10亿

计算机行业研究：百度发布文心5.0重回第一梯队，李飞飞押注世界模型路线

苹果首款MR头显发布，百度文心千帆大模型平台成立

【百度文心一言发布会点评】国金计算机事件：百度于3月16日召开“文心一