行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

大模型时代生产力工具转型的技术探索_詹明捷

公用事业 2023-08-02 ArchSummit深圳2023|全球架构师峰会爱吃胡萝卜的猫 

核心观点与关键数据

人工智能新范式（AGI）已经到来：大模型使能的AGI与传统AI处理任务对比，展现出更强的能力。
大模型核心能力：架构设计、分布式训练等，技术路线演化中GPT类模型处于领先。
大模型关键技术路径：
- Encoder类模型（BERT为代表）：通过fine-tune提升性能，OpenAI坚持生成式任务目标实现突破。
- Decoder-Only类模型（ChatGPT为代表）：更关注zero-shot文本生成能力，结构效率更高，OpenAI通过系统工程角度提升训练效率。
- 训练成本与路径依赖：大模型训练成本极高，企业组织因历史原因多沿用自身验证路线。

技术路线对比

Encoder-Decoder or Encoder-Only (BERT类)：
- 训练方式：Masked Language Models。
- 模型类别：Generative。
- 预训练任务：Predict next word。
Decoder-Only (GPT类)：
- 训练方式：Autoregressive Language Models。
- 模型类别：Discriminative。
- 预训练任务：Predict masked words。

思维链与多任务训练

思维链：激发语言模型解锁更强的推理能力，右侧图绿色部分为思维链。
多任务训练与指令微调：提升模型复杂任务处理能力。

下一代软件开发范式：AI FOR AI

AI是生产生产力工具的工具：AI FOR AI推动软件开发变革。
智能化、模块化、标准化的AI生产工具：
- AI辅助开发：一键调度大算力、数据驱动、快速部署。
- 软件开发角色：
  - 分析师：制定高层次计划，分解任务。
  - 程序员：编写代码，修复细化代码。
  - 测试员：生成测试报告，而非直接生成测试用例。

新二八定律与软件开发新体验

新二八定律：代码 = 80% AI生成 + 20% 人工。
软件开发体验变革：人类需求满足方式和底层依赖发生变化，编程逻辑变革。

生成式AI技术延展

延展应用：
- 用代码解决视觉问题。
- 基于多仓库融合的代码生成。
- 基于代码解决数学题。

联系方式

如有兴趣进一步了解商汤AI代码助手，可联系：sensecode@sensetime.com。

商汤科技AIGC研究与应用团队负责人詹明捷人工智能新范式（AGI）已经到来大模型使能的AGI与传统AI处理任务对比大模型核心能力架构设计、分布式训练等 LLM技术路线演化，GPT类模型处于领先大模型关键技术路径 •Encoder类模型（以BERT为代表）在过去的方案中经过fine-tune性能会更强。OpenAI也是坚持自身以生成式任务为目标的技术理想，终于实现突破 •随着考察任务的变化，现在大模型更关注zero-shot的文本生成能力（更贴近AGI），Decoder-Only类模型（以ChatGPT为代表的）更方便利用海量的无监督文本数据进行训练 •Decoder-Only类模型结构效率更高，OpenAI以系统工程的角度看待训练，着重训练效率，坚持此路线 •如今大模型训练成本极高，由于历史原因，各企业组织（如Google）存在路径依赖，大多沿用自身已经验证通过的路线。 Encoder-Decoder or Encoder-Only (BERT类)•训练：Masked Language Models Decoder-Only (GPT类)•训练：Autoregressive Language Models •模型类别：Generative•预训练任务：Predict next word •模型类别：Discriminative•预训练任务：Predict masked words 什么是思维链？思维链激发语言模型解锁更强的能力，解锁更复杂的推理任务，右侧图绿色部分为思维链多任务训练指令微调编程工具的发展史 AI是生产生产力工具的工具AI FOR AI 下一代软件开发范式：AI FOR AI 人工智能大模型智能化、模块坏、标准化的AI生产工具 AI辅助开发、一键调度大算力、数据驱动、快速部署软件开发不同角色：分析师、程序员和测试员分析师：分析师的目标是制定高层次的 plan 并专注于指导程序员编写程序，而不是深入研究实现细节。给定需求X，分析师将分解为几个易于解决的子任务，以方便程序员直接实施，并制定概述实施主要步骤的 plan。程序员：作为该团队的核心角色，程序员将在整个开发过程中接收来自分析师的 plan 或来自测试人员的测试报告。将两项主要职责分配给程序员：1. 编写满足指定要求的代码，遵守分析师提供的 plan。2. 修复或细化代码，考虑到测试人员反馈的测试报告反馈。测试员：测试人员获取程序员编写的代码，随后记录包含各个方面的测试报告，例如功能性、可读性和可维护性。与直接生成测试用例相比，生成测试报告更符合语言模型的倾向。自动Debug 自动Debug 新二八定律：代码 = 80% AI 生成 + 20% 人工新二八定律：代码 = 80% AI 生成 + 20% 人工 “新二八定律”带来软件开发新体验语言与操作系统，是当前人类与世界知识交互的核心媒介依赖: •人类需求被满足的方式和底层依赖发生变化。➡️底层编程逻辑变革业界持续推出生成式AI技术延展延展：用代码解决视觉问题延展：基于多仓库融合的代码生成延展：基于代码解决数学题 THANKS 如果您有兴趣进一步了解商汤AI代码助手，可联系：sensecode@sensetime.com

点击免费查看完整报告

大模型时代生产力工具转型的技术探索_詹明捷

核心观点与关键数据

技术路线对比

思维链与多任务训练

下一代软件开发范式：AI FOR AI

新二八定律与软件开发新体验

生成式AI技术延展

联系方式

你可能感兴趣

大模型时代的可观测技术探索与实践

大模型时代的可观测技术探索与实践

大模型生产力工具的思考与实践

大模型生产力工具的思考与实践

Web3时代的生产力工具：AIGC

捷成股份文生视频1月6日正式上线AI大模型与机器人时代的卖水人

大模型时代下软件开发的场景和探索

2024大模型技术及其在金融行业的应用探索报告

大模型技术在燃气行业的创新探索

书生万象大模型的技术演进与应用探索