热门搜索：

微众银行大模型助效研发实践——AI为主角、人为助手的协作模式

金融2024-07-16黄叶飞极客传媒F***

AI智能总结

微众银行研发效能提升与AI协作模式探索

主要问题与挑战

复杂性挑战：微众银行面临研发流程的复杂性问题，包括人员管理、产品开发、合规审查等多方面的挑战，导致效率低下和成本上升。
需求变动：市场快速变化导致需求频繁变动，要求快速响应和交付，增加了研发压力。
沟通与知识管理：岗位和角色的分工带来了沟通成本，同时，产品迭代和人员变更产生的大量知识需要有效管理和传承。

大模型的应用探索

初步应用：在ChatGPT等大模型的启发下，微众银行尝试利用AI技术提升研发效能，特别是在代码审查、实时代码生成、自然语言转代码、代码注释等方面取得了初步成效。
具体应用案例：
- 代码Review：系统自动推荐代码片段，提高审查效率。
- 实时续写：通过自然语言描述需求，直接生成代码，加速开发进程。
- 代码注释：系统提供代码解读，生成逻辑图和时序图，提升代码可读性。
- 微调模型：通过模型微调，针对特定代码集进行优化，提高针对性和效率。

遇到的困难与挑战

模型局限性：当前大模型在处理代码上下文、理解特定业务场景、代码微调等方面存在限制，尤其是在模型容量、计算资源和知识更新速度上。
集成与协同：在实际应用中，如何有效集成大模型与现有开发工具，形成高效协同的流程是关键挑战。
模型训练与成本：大模型训练成本高，资源需求大，如何平衡模型效果与成本效益是重要考虑因素。

多Agent协同策略

RAG技术：通过RAG（Read, Analyze, Generate）技术，增强Agent能力，解决模型微调中的问题，提高代码理解和生成的准确性。
Multi-Agent系统：
- 基础Agent：集成开发工具，实现基础功能如需求分析、版本控制等。
- 多环节Agent：根据业务场景，如文档生成、代码生成、测试等，设计不同层次的Agent。
- 全流程Agent：实现从需求到代码生成的全链条自动化，提升整体效率。
人机交互优化：
- 让AI成为主角：通过优化Agent设计，提升其理解和执行能力，减少人工干预，使AI在决策和执行中发挥更大作用。
- 人机协同：尽管Agent承担大部分工作，但仍需要人工参与规划、反馈、调整，确保结果符合预期，实现人机高效协作。

展望与未来

技术进步：期待未来更多高效、智能的工具和平台，进一步降低AI应用门槛，促进更多人参与到Agent开发中来。
流程自动化：随着技术成熟和经验积累，期望实现更自动化、稳定的研发流程管理，提升整体效率和质量。

通过上述探索与实践，微众银行正逐步构建以AI为主导、人类为辅助的高效研发协作模式，旨在解决传统研发流程中的痛点，提升整体研发效能。

微众银行大模型助效研发实践 AI为主角、人为助手的协作模式微众银行：黄叶飞研发流程面临的主要问题大模型在研发效能上的初步探索大模型辅助研发遇到的困难目录 Agent离不开的RAG Multi-Agents实现研发流程提效让AI成为主角的人机交互方式研发流程面临的主要问题？复杂内部研发效率主要体现在其复杂性上：人员、产品、监管事情应接不暇。研发复杂性所带来人力成本逐步变大，如何解决？需求变化应对快速市场变化，需求变化快，要求交付速度快复杂流程银行面对的流程相对来说更复杂，更严格个人效率较多相似工作，不同工具使用导致个人效率的差异沟通成本岗位和角色分工清晰，所带来的是沟通成本的提升知识沉淀产品迭代、人员迭代产生大量的知识不同岗位工作内容的复杂性占用不少研发成本产品产品文档设计稿交互稿开发架构文档系统流程图表结构文档接口文档 Coding 单测联调流程组件负载均衡微服务治理文件接入CDN …… 测试接口测试功能测试性能测试测试环境Bugs 运维版本发布线上运维系统监控大模型在研发效能上的初步探索初试在ChatGPT出来后，大模型似乎能辅助研发效能的提升。 AI辅助编程初步提升开发效率代码Review 提前发现代码变更引入bug、对有可能出现问题代码进行警告代码解读支持系统级别和方法全链路代码解读，并生成相关逻辑图、时序图等行/函数级实时续写在编程时，系统会根据你写的内容和语法规则，自动推荐可能的代码片段代码注释快速生成方法和行内注释，减少编写注释所需时间，提高代码可读性自然语言转代码通过自然语言描述需求，在编辑器区域直接生成代码微调模型的试验之路是否可行一个团队内的所有代码一个小JAVA开发团队的代码量在2-3G大小（前端开发团队也有在做微调，但只针对公共组件的使用上）单元测试案例及代码提取代码中的单元测试案例、以及单元测试的代码，更精准的做代码微调公共组件使用文档真正的组件文档大小并不大，在700多M，在开发过程中便于模型能理解公司内部的基本组件并知道如何使用；同时将公共组件调用生成问答对更进准的让模型理解代码解释及关联代码首先把所有代码把无注释的代码先生成一份代码注释、然后将代码注释及代码用于做微调大模型辅助研发遇到的困难困难前期辅助编程方案并无法在研发流程中解决开发太多的痛点。研发人员在软件开发中的时间投入统计约60人的团队情况：编码占研发工作时间比例并不高，进而需要更全面的提效方案代码编写37% 开发人员实际做代码编写的工作占比并不高需求分析10% 其他22% 代码编写 37% 方案设计 8% 需求分析 10% 联调及测试 23% 好的需求分析工作对后期的研发有极大帮助联调及测试23% 复杂的环境及多服务串联所带来的联调及测试问题也多方案设计8% 方案设计是系统稳定性、健壮性、可扩展性、安全性等非功能的重要环节其他还有线上问题以及各种其他工作模型终归不是我们理解的那么简单 2024-04-17 Mistral8X22B 2024-04-24 Qwen-1.5110B 2024-05-13 Yi-1.56B,9B,34B 开源模型迭代速度快几乎每个月都有新模型�来研发知识迭代影响几乎每周都有版本更新 2024-03-27 DBRX132B 2024-04-18 LLaMA-38B,70B 2024-05-06 DeepSeek-V2236B 模型Token数限制尤其是代码上下文数据巨大微调服务器成本高昂微调需要独占GPU资源，且巨大 Agent离不开的RAG 方法 RAG可以解决模型微调中的不少问题。 Answer Agent离不开的RAG 生成 Prompt LLM RAG处理流程-提升Agent能力数据处理文件处理结构化解析代码分析图像识别检索代码检索专业术语检索功能检索数据关系检索研发知识库需求文档接口文档组件使用说明数据库表结构产品说明测试案例系统设计文档代码信息 Question 知识存储问题分析向量化存储 Multi-Query 图数据存储 Step-back 结构化存储 KV数据存储 RAG-Fusion HyDE Multi-Agents实现研发流程提效实践从集成基础工具到不同业务场景的Agent实现。一个升级Jar包的工单Agent实现需求分析Agent CodingAgent CIAgent 1⃣根据工单号拉取详情组件Agent 通过模型识别需要升级的组件 1⃣根据流水编译打包 2⃣根据详情识别需要升级的组件版本号Agent 分配系统需要发布的版本 2⃣异常判断 GitTool Git操作 CodeAgent 生成新的代码操作输出：标准Json FileTool 文件编辑、修改操作异常处理Agent 01基础Agents 02简单Agent 03多环节Agent 04全流程Agent 集成开发工具以实现基础的Agents 通过简单Agents实现研发所需的基础Agent 集成基础的开发工具约定Agent之间的协议实现一个相对闭环的能力 01基础Agents 02简单Agent 03多环节Agent 04全流程Agent 从CURD入手，实现简单代码的生成以表驱动实现后端代码的Agents 通过RAG识别表个性化支持包名根据表生成相关代码大模型推荐命名 01基础Agents 02简单Agent 03多环节Agent 04全流程Agent 以接口驱动实现多环节的Agents-文档生成 ❖需求文档对字段要求文本化❖支持接口文档系统上导入需求直出接口 ❖结合RAG识别字段的常用命名测试 TestCase 参数算法后台 ServerCode 模版 RAG 如意 01基础Agents 02简单Agent 03多环节Agent 04全流程Agent 以接口驱动实现多环节的Agents-代码及测试接口文档前端 WEBSITE Prompt 风格 Letgo 01基础Agents 02简单Agent 03多环节Agent 04全流程Agent 以需求文档驱动实现全流程Agents 需求分析需求文档做字段抽取、接口抽取、逻辑抽取、结合RAG拆分需求接口定义根据需求分析产�的字段生成接口表结构创建需求功能点+现有表RAG确定新表创建SQL 代码定位根据功能+代码库信息确定代码所实现的位置测试单测+SIT测试并根据错误及异常生成新的Issues 编译部署以工具为主代码Review 代码Review判断生成代码的完整性、是否合理等代码生成拆分代码任务生成每段代码，并更新到相关文件 01基础Agents 02简单Agent 03多环节Agent 04全流程Agent 需求分析Agent 抽取名词抽取字段确认功能点拆分需求 ReGen 表生成Agent RAG 表规范Agent 抽取字段规则校验 Tools 生成表结构 LLM_1 Planning Memory Task1 Task1Task1 Memory …… Agent多样性 不同的Task定义不同Agent Agent通过Memory串联 RAG和Tools是个性化的条件 RAG LLM_1 需求文档 PromptTemplate 以需求文档驱动实现全流程Agents 01基础Agents 02简单Agent 03多环节Agent 04全流程Agent 实现从需求到代码自动生成让AI成为主角的人机交互方式优化大量的Agent需要人工参与才能实现完整的功能。 React：无法识别你的工具 不允许返回XXX，还是返回了XXX 要求返回XXX，就是没返回XXX 理解Prompt的能力有限让AI成为主角的人机交互方式模型能力对于Agent的影响导致无法自动化无法完整返回你要的内容不是你想要的Planning Agents完成主要工作人人可用不是人人都去写Agent，但目标是人人都能用上Agent，而Agent做执行的工作只能完成部分，故Agent能优先执行，人去调整Agent执行的结果。人工调整Agent制定的Planning Tool Reflection Action1 Tool Planning Self-critics Action2 ……Chainofthought Action3 Action1 Confirm Action2 Action4 Action5 Reasoning AskforInput Add/ModifyTool 每个Agent的设计可由人参与并做调整 Planning调整人工调整Planning的任务，并让LLM重新确认 Prompt调整复杂的Prompt的会导致LLM生成有偏差人工参与完成任务每个任务都有可能Agent执行失败，人工支持参与实现 Agent协议上下游关联的Agent之间需要定义清晰的协议，在人工调整过程能让协议也自动生成正确工具调整工具的命名、描述会对LLM的识别有影响，需要支持人工随时介入调整重新执行 Agent断点、重新执行、幂等展望未来更多便利的工具；更多人投入Agent开发；更稳定的环境；更自动化的流程管理

点击免费查看完整报告