背景现状 01 发展趋势 02 信通院工作介绍 目录 03 内容生成知识管理软件工程 气象 机器人 盘古气象大模型 谷歌气象大模型 机器人 特斯拉 Pangu- GraphCast RT2 OptimusGen2 Weather 2023年7月 2023年7月 2023年12月 2023年7月 以Transformer架构为基础的大模型不断取得新突破,进一步确认了人工智能技术发展走向新范式 自动驾驶生物化学 特斯拉 FSDV12 上海实验室 UniAD 谷歌AlphaMissense蛋白质预测 谷歌 GNoME 晶体结构预测 语言 OpenAIGPT-42023年3月 2023年8月2023年6月 2023年9月 2023年11月 大模型三个主要特征 视频生成 谷歌VideoPoet2023年12月 规模可扩展性强 多任务适应性强 能力可塑性强 大模型 传统AI 规模增大不能带来性能持续提升 参数规模、计算量和训练数据增加可带来模型性能持续提升 ScalingLaw) 通过模型微调、思维链提示等措施即可实现能力进一步增强 一个模型能同时支持多种任务和多个模态甚至实现跨模态 模型训练完成后能力无法进一步拓展 一个模型只能胜单任务 和单模态 底层算法走向统一使得人工智能平台化成为可能,基础模型正在成为新的“操作系统”,创新不断提速 随着人工智能技术的不断进步,特别是大模型能力的持续提升,软件工程领域正迎来前所未有的变革,软件工程的 流程和模式正被重新定义,软件智能化进程显著加速。 软件工程发展历程软件工程3.0—“智能化软件工程” 1968年 NATO会议 “软件工程”学科诞生 2001年 敏捷软件开发宣言发布 2022年 ChatGPT发布 围绕“智能化”理念以构建智能化助手(Copilot)为起点,通过使用大模型为核心的AI技术驱动软件全生命周期能力升级。 软件工程3.0 软件工程2.0 软件工程1.0 智能化数据驱动交互性 自适应 各工具都将逐步实现对大模型等AI能力的调取和应用,以提高工具自身能力的,为智能化软件工程打下坚实基础。 高质量数据是大模型成功的关键,“GarbageIn,GarbageOut”仍然适用。 大模型与人之间的人机交互 大模型与工具间的交互 根据对工程级代码的更优理解能力,以及检索增强生成(RAG)等工具的辅助能力,大模型的自学习能力越发强大. 结构化、规范化、工程化 以瀑布模型为代表 持续构建、持续集成、持续交付 以敏捷开发、DevOps为代表 理解能力、生成能力 以AI技术为代表 持续优化 通过建立数据飞轮和反馈闭环,根据用户反馈、场景化数据和监控数据对大模型持续改进。 围绕软件全生命周期,以提高质量和效率为核心,以解决问题为点,用AI全面使能,推动智能化进程 软件工程生命周期 时间占比 35%20%45%持续性工作 初步提效 研发过程需求分析系统设计编码实现测试阶段部署交付运维阶段 AI需求分析 辅 助需求续写 需求验证 需求评审 需求检查 效能提升环节示例 UI设计 数据库设计 配置检查 架构设计 接口设计 代码生成补全解释 代码审查 代码重构 单测生成 测试用例生成 缺陷分析 自动化测试 测试脚本生成 有望提效 日志分析 配置生成 运维问答工单处理 探索提效 依托Agent等技术,全面实现测试流程自动化与智能化,显著提高测试效率和质量 横向 发展 故障修复 自动化部署 缺陷修复 全流程编码 设计评审 故障定位 利用Agent、RAG等技术,实现运维阶段故障自动定位与修复, 达成智能化运维目标 AI能力可集成至CAE等工程计算软件中,增强 国产计算软件的性能, 助力提升现有能力局限 AI能力可深度赋能工业软件开发、嵌入式 开发等场景,提升工纵向 业智能化水平发展 软件开发是大模型率先应用落地的领域之一,Gartner已将“AI增强软件开发”列入2024年十大战略技术趋势之一。 智能开发发展现状 智能开发工具市场迅速发展, 国内外百花齐放 智能开发工具能力持续提升,应用行业更加多元化 应用需求快速增长,编码阶段提效显著 使用智能开发工具的人数和频率越来越多; 智能开发工具的使用助力开发人 员编码效率提升明显。 智能开发价值显现 软件开发的智能化转型正成为企业提升软件产品竞争力的 关键因素。 提升开发效率,降低项目风险 BIS年度经济报告:AI编程工具对程序员的生产力提升超过50%,且其中中仅有小部分来自于代码的直接生成,而更多是通过与机器交互的过程激发了程序员的创造力。 改善代码质量,提高产品稳定性 GitHubCopilot可帮助开发人员在编码过程中解决超过三分之二的漏洞。 加速产品迭代,增强企业竞争力 2023年5月GitHub首席执行官在全球网络峰会上,演示GitHubCopilotX实现简单的贪吃蛇小游戏用时为18分钟,而2024年8月通过真实操作,使用Deepseek编码助手(V2)仅需2分钟左右,开发时长大幅减少,开发人员将有更多时间思考产品创新。 1 智能开发框架 2 核心进展 应用层 IDE智能编码 代码生成代码补全 代码解释代码注释 开发者辅助 研发问答bug排查 代码优化代码搜索 智能开发作为智能化软件工程中的早期发力点,落地路径趋于成熟,交互方式发生变革,开发阶段效率全面提升 互联网、金融代码自动化生成比例可达35% 智能化开发工具企业内部推广使用率30%+ 综合提效 全生命周期综合提效10%~55%,编码提效50%+,单测提效40% 智能开发工具综合采纳率达到35.8% 基础大模型 研发问答大模型 代码大模型 模型层 安全过滤 工程化层 模型调度 模型定制 3 效能提升 *数据来源:信通院国内案例征集及调研访谈 研发效率提升 解决的问题 大量重复性编码得以释放,效率大幅提升 交互方式革新 从低代码平台拖拽式和积木式交互到AI编程助手自然语言交互 落地方式变革 4 未来挑战 应用层 代码资产保护、智能化水平衡量、落地路径不明确 技术层 推理结果处理、模型在线 学习与AIAgent结合 应用层 工程化层 技术层 从传统行级代码开发,到跨文件代码生成 工程化层 工具衔接、模型量化、适配能力 当前大模型在测试领域的局部应用是可行的,但考虑到测试工作的复杂性,基于Agent通过大模型+小模型+测试 2 效率提升 Agent 新技术 大模型 传统技术 小模型 测试工具 测试执行 试 计 划 测试分析 测试设计 测试实施 测试评估与报告 结束测试 测试控制 测 1 智能测试视图 工具协调实现新一代智能测试,将是未来智能测试短期发展过程中的必然方式 大模型更佳 工具更佳 ML模型更佳 3 核心功能 功能测试用例设计 减少简单重复性测试用 例设计工作,节省时间 问题2 问题3 自动化测试脚本生成 某互联网企业已在200+产品业务中应用智能测试 工具,测试用例采纳率达到40% 互联网企业应用 某科技企业应用智能测试工具生成测试用例采 纳率达55%,测试用例脚本编写效率提升 30% 数据来源:AI4SE工作组成员单位应用效果 科技企业应用 4 未来挑战 模型性能局限 测试需求理解需要 理解更长的上下文 未来挑战 数据质量问题 数据参差不齐,高质量数据集成本高 多模态能力不足 对流程图、架构图 等缺乏有效理解 效果评估指标 模型缺乏指导与评测有效指标 智能化的测试脚本代码生成,极大提升测试阶段编码效率 测试需求理解释放需求理解分析所消耗的人工 问题1 解决的问题 问题4 用例评审与修复对历史用例评审修复,降低维护成本 短中期内大模型作为助理用于智能问答、故障识别与预测;长期来看,融合AIOps小模型工具构建具有感知、交互、 情景记忆、判断决策的智能体运维大模型是未来的发展方向。 1 智能运维视图 2核心功能 多样化场景 异常检测 告警分析 故障处理 成本效率 运维回答助手 知识图谱 AIOps小模型工具 大语言模型 通过对大量公开/本地的运维数据和技术资料的理解,大模型可以帮助构建知识库,对用户的查询提供准确回答。 表现较好 自动工单处理 通过理解工单内容,大模型可以自动分派工单,甚至在一些常见问题上,直接提供解决方案,减轻人工处理的压力。 3 领域痛点 依赖繁多 痛点 大模型存在关键点不清晰、幻觉问题 使用大模型需结合多智能体和知识库 训练成本高 维护成本高 传统AIOps积累的数据质量参差不齐训练成本较高,难以有效利用 运维阶段持续产生的数据量较大 在线学习困难,持续维护成本高 数据注释 多模态数据指标日志告警拨测配置 针对设备类型、日志关键字、告警类型等日志信息进行有效解释,采用自然语言的方式进行转述,帮助工作人 员进行理解。 自动诊断告警信息 通过利用大模型对历史工单信息进行学习,对比历史止损方法,提供与历史故障的相似性对比以及当前最优化的止损方法。 有待改进 网络故障识别与预测 大模型可以通过学习日志文件和错误报告,提前发现和预测可能的问题。同时,通过对历史案例的学习,AI可以提供可能的修复建议。 提供安全运维支持 大模型可以帮助发现潜在的安全威胁,改进安全规则,并支持应对安全事件。 userid:529794,docid:175178,date:2024-09-20,sgpjbg.com 背景现状 01 发展趋势 02 信通院工作介绍 目录 03 围绕低代码+AIGC模式,多模态人机交互或成趋势 低代码平台的发展迎来新的春天,未来结合大模型能力将推动低代码开发的演进,且多模态或将成为软件 研发交互形式的新趋向 低代码→无代码(自然语言) 交互模态 未来的软件开发将越来越低代码化,用自然语言开发软件不会遥远,真正意义上降低程序员的技术门槛 RAG:私域代码等知识库;Agent:各类已有工具... GPTS:3分钟构建一个简易的GTPS 从单一的文本交互到文本、语音、设计草图、流程图、xmind、讨论记录、文档等多模态叠加的人机交互的软件研发成为趋势 在大模型助力软件研发活动的实践过程中,将衍生出新的以大模型为趋动的新研发模式,协同方式从大兵团作战向特种兵行动演进,将为软件产业带来颠覆性变革 Waterfall 瀑布模式 Agile(CI/CD/CM) 敏捷模式 LargeModelDriven 大模型趋动的模式 软件研发模式的演进 顶部较大--强调前期的需求分析、统一的架构设计 底部较小--借助大模型生成后期的设计方案、代码,可 大幅度减少人工依赖 全员软件开发者 架构师+大量软件工程师+ 自动化工具工程师 架构师+少量软件工程师+大模型Agent 组织角色的演进 多触角--代码调试、测试验证、应用部署、系统运维等多模块并行 大兵团作战 程序员、测试人员、IT运维等众多工程师职责明确,持续讨论、互动协调、旷日持久的研 发活动 特种兵行动 在大模型的引导下,独立自主 或寥寥数名工程师相互配合,进行短期内的交付活动,其中每一位工程师皆能多面手 以前及当下不久的未来 Copilot->Pilot 为软件生产过程赋予智能化能力 软件生产智能化 软件->智能化软件 为所有软件赋予智能化能力 软件服务智能化 人人都是开发者 基于大模型的软件开发新生态 软件开发新生态 AI×SE 背景现状 01 发展趋势 02 信通院工作介绍 目录 03 1、完成代码大模型、智能开发2项标准发布(一、二季度) 2、已启动软件智能化测试相关标准编制(三季度) 3、适时启动Agent&软工、智能运维等标准编制(三、四季度) 代码大模型标准 ITU立项成功 智能开发能力标准 IEEE立项申请中 1、已完成代码大模型首批评估结果 发布(6月) 2、已完成代码大模型第二批及智能 编码工具首批评估结果发布(8月) 腾讯混元代码大模型 4+级 依