腾讯云教育⾏业⼤模型 ⼀、 ⼤模型发展历程 回到热点,ChatGPT演进过程 2014 微软小冰 2016 苹果Siri 2019年投资OpenAI;2021年Github与OpenAI联合发布Copilot;2023年Q1,微软系产品领航ChatGPT化⋯⋯ 2016 发布Gym强化学习平台&Universe训练工具包 2018.6 GPT-1 1.17亿参数 无监督预训练 +有监督微调 2019 GPT-2 15亿参数 半监督语言模型效果验证 2020 GPT-3 1750亿参数 超大模型 2022年初InstructGPT13亿参数 人类反馈强化学习 2022年12月 ChatGPT 基于GPT-3.5 微调后用来改 进GPT语言模型的聊天机器 2023年Q1GPT-4 提升性能, 更贴近人类实际思维 第一阶段:模型规模增大,融合的任务更多 2017-2022年初 演进动力:训练语料&模型容量更大 人 第二阶段:利用人工标注引导生成 2021年底-至今 演进动力:从人类反馈中学习 深度学习框架TensorFlow发布分布式版本 2017.6 Transformer 6500万参数 2018.10 BERT 3亿参数 2019 T5 110亿参数 2021 SwitchTransformer 1.6万亿参数(人类大脑皮层参数10万亿) ChatGPT的关键技术点1:千亿参数大模型以及对应的海量训练数据 从“量变”到“质变”,AI进入“大模型”时代 应 用场 景 风控模型 信用评估、欺诈检测、订单评估、账号安全、支付风险、内容审核、工业质检、舆情分析…… 智能问答 语音助手、企业客服、呼叫中心、专家咨询、智能助教、智能导诊、销售助手、培训辅导…… 内容创作 营销文案、模版写作、剧本创作、编曲填词、访谈提纲、论文综述、课程设计、广告创意…… 推荐系统 商品推荐、广告投放、搜索引擎、商户运营、用户运营、内容运营、视频标签、服务匹配…… 计算智能 表示、计算、存储与人机输入、输出 感知智能 文本内容识别、图像识别、语音识别 认知智能 知识数据双驱动、认知智能、决策智能 意识智能 “涌现”能力思维链 大模型 数据算法 算力prompt Ref.《清华大学:人工智能发展报告2020》 产业落地实效 成大模型价值重要评估维度 更多场景 传媒媒资管理内容生产媒体传播 金融客户服务风险管理分析决策 工业研发设计生产制造管理服务 政务流程管理决策支持社会保障 交通智能调度运行监测模拟预测 能源自动监测报警诊断运维管理 图片生成聊天对话文案创作视频生成 营销方案 购物推荐 广告营销商业客服旅行攻略购物推荐 文档摘要文本翻译文字识别⋯⋯ 我国10亿参数规模以上的大模型已发布79个 ⋯⋯ 能力更“强” 专业知识+推理能力特定领域表现及适应性 效率更“高” 助力生产、经营、管理重塑业务模式 场景更“广” 百行千模 满足更多行业需求 应用更“深” 大模型+AI原生应用推动业务全链条智能 2023年,多地市发布人工智能相关政策 5/30,北京市政府发布《北京市加快建设具有全球影响⼒的⼈⼯智能创新策源地实施⽅案(2023-2025年)》、《北京市促进通⽤⼈⼯智能创新发展的若⼲措施》。 国产⼈⼯智能芯⽚和深度学习框架等基础软硬件产品市场占⽐显著提升,算⼒芯⽚等基本实现⾃主可控。国产硬件⽐例显著提⾼,全⾯兼容国产深度学习框架。⼈ ⼯智能算⼒资源并⽹互联,推动基础软硬件实现⾼质量⾃主可控。AI核⼼产业规模达到3000亿元,持续保持10%以上增⻓,辐射产业规模超过1万亿元。 5/31,深圳正式印发《深圳市加快推动⼈⼯智能⾼质量发展⾼⽔平应⽤⾏动⽅案(2023-2024年)》 组建深圳市AI教育联盟和AI讲师团,⽀持⾼校、企业围绕通⽤⼤模型等领域开展⼈才联合培养。形成规模1000亿元的⼈⼯智能基⾦群,⿎励⼤模型企业联合⽣态伙伴加强⼤模型插件及相关软硬件研发;⿎励企业研发基于国际主流⼤模型的创新产品。 6/5,成都市公布《成都市关于进⼀步促进⼈⼯智能产业⾼质量发展的若⼲政策措施(征求意⻅稿)》 ⽀持企业、科研机构开展核⼼算法与专业算法研发,布局⼤规模语义模型、⾏业模型等,对取得国家科技重⼤专项(含科技创新2030-重⼤项⽬)、国家重点研发计划⽴项项⽬成果或国家科学技术奖获奖成果在蓉落地转化的,给予最⾼1000万元经费⽀持。 6/14,⽆锡发布全《⽆锡市⼈⼯智能产业创新发展三年⾏动计划(2023-2025)》 到2025年,⼈⼯智能核⼼产业规模达到400亿元,带动相关产业规模4000亿元。以⾃动驾驶、智能制造、⽣成式⼈⼯智能为主攻⽅向,加快⼈⼯智能关键技术转化应⽤,⽬标是累计认定50个省级以上⼈⼯智能融合创新产品应⽤解决⽅案,打造100个可复制、可推⼴的典型示范应⽤场景。 7/12,福建省⼈⺠政府办公厅印发《福建省新型基础设施建设三年⾏动计划(2023—2025年)》 强化建设⼈⼯智能平台。强化智能芯⽚、基础软件、深度学习、AI模型、智能算法等⼈⼯智能关键环节攻关。围绕制造、农业、交通运输、教育医疗等领域,打造AI深度融合场景。⽀持福州创建国家⼈⼯智能创新应⽤先导区。实施智慧教育⼯程,到2025年,建设10个省级“智慧教育试点区”、100所省级“智慧校园试点校”。 7/24,重庆市印发《重庆市以场景驱动⼈⼯智能产业⾼质量发展⾏动计划(2023—2025年)》 培育10家亿级以上⼈⼯智能⻰头企业,集聚100家⼈⼯智能规模以上企业、建成3—5个⼈⼯智能产业集聚区。⿎励科研机构、⻰头企业积极争取参与⼤模型旗舰项 ⽬,围绕AI⼤模型、AI开发框架及⼯具体系等⽅向,建设⼈⼯智能开源社区。 8/13,宁夏回族⾃治区⼈⺠政府办公厅印发《促进⼈⼯智能创新发展政策措施》 推动以国产化CPU、GPU等硬件,算⼒平台和⼤模型的⾃主研发,对于参数量超过百亿、典型应⽤场景超过5个的⼤模型,根据相关政策给予不超过项⽬总研发投 ⼊30%、最⾼1000万元资⾦⽀持。 ⼆、 产品概述 ⽤户 终端 场景 教育教学 管理服务 科研创新 …… 智能台灯 智能平板 智能学习机 ⼿机 PC 管理⼈员 ⽼师 家长 学⽣ 场 景 应 ⽤ 层 ⼝语练习助⼿ AIforEducation 教案⽣成 招⽣助⼿ AIforService 教务助⼿ AI 能 ⼒层 教 育AIforScience 学⼯助⼿ 后勤事务 奖助学金 ⽂献助⼿ 文献问答 文献摘要 领域⾏业⼤模型 医疗行业大模型 交通行业大模型 金融行业大模型 教育行业大模型 ⾏业 成绩查询 选课咨询 培养计划 专业咨询 课本/教学材料 教学视频 教案润色生成 角色扮演 口语评测 任务对话 自由对话 ⼤模型能 知识引擎(应⽤构建平台) 运营调优 应⽤配置 知识管理 知识解析和应⽤ 教育⾏业⼤模型 腾讯云TI平台(模型构建平台) ⼤模型精调和服务 教育⾏业⼤模型 模型管理 训练⼯坊 数据中⼼ ⼒层 基础 模型层 教育行业大模型 开源大模型 混元大模型 ⽀撑层 ⾼性能计算(HCC) ⾼速互联⽹络(RDMA) ⾼性能数据库(向量数据库) •知识引擎产品定义2.0:基于大语言模型的知识应用构建平台,提供知识问答、知识总结等应用类型及原子能力服务 教案⽣成 虚拟导游 代理⼈辅助 汽车助⼿ 电⼦说明书 员⼯服务 物业管家 腾讯内部产品合作 智能客服 •知识引擎和教育⾏业⼤模型:教育行业大模型依托知识引擎对外输出;教育行业大模型在知识引擎模型层,作为可选的模型之一 合作伙伴应⽤共创 教育 ⽂旅 ⾦融 汽车 零售 能源 地产 数智⼈ 安灯 乐享 知识引擎核⼼功能 开箱即⽤的应⽤类型(应⽤中⼼) 知识问答类 知识库问答 ⽂档问答 知识总结类 知识摘要 标签分类 灵活定制的接⼝服务(原⼦能⼒中⼼) ⽂档解析 向量检索 多轮改写 开放对接层 教育⾏业⼤模型 ⾦融⾏业⼤模型 医学⾏业⼤模型 精调知识⼤模型 混元⼤模型 应⽤配置 知识库管理 应⽤评测 审核发布 数据看板 运营调优 配置层模型层 三、 应⽤场景 核心能力 •主题对话练习模式:围绕特定主题进行英语对话练习,支持难度调节,结束对话后可自动生成评测报告; •口语对话评测模式:可根据学生需求制定相应单词和句子跟读训练,并实时给出用户发音评测结果,辅助学生进行针对性的强化练习。 数智人对话任意主题对话语音输入 英语口语 中文口语 方案场景 主题对话练习 多轮对话 设定场景 语法纠正 发音纠正 对话提示 评测报告 口语对话评测 跟读模式 词汇建议 翻译 字幕 对话记录 单词记录 方案能力 对话时长 评测分数 单词数量 数据接口 腾讯自研大模型 智聆口语评测 数智人 TTS 底层能力 撰写 润色 更新 整合 课件复制照搬 一线教师课件更新频率低、教学精力不足,制作课件就等于下载或组合课件,学校的集体备课就相当于分工搜索下载,到置课件内容质量低、创新性不足 教学案例老旧 新课改背景下,《职业教育专业教学资源库建设指南》明确,高职教学资源库每年更新比例不低于10%,知识更新周期缩短。教学案例更新的时效性要求相应提升 教学活动枯燥 2023年8月,教育部发布《职业教育专业教学资源库建设指南》鼓励合理运用视频类、动画类、虚拟仿真类等资源,传统教案面临着形式枯燥、多媒体素材缺失挑战 教案撰写耗时 调查表明,20%的精力用于钻研教材、了解学情,80%的精力用于书写教案。教师每周工作中54%时间用于备课教案、汇报材料撰写等 场景示例 一键生成教案 声情并茂润色 请生成一张人教版语文五年级《威尼斯小艇》的课程教案图片 腾讯混元助手 给定教材、课时,生成教案 多模态素材生成 课件辅助生成 请生成人教版地理八年级下册《自然特征与农业》的课件PPT大纲 腾讯混元助手 以下是人教版地理八年级下册《自然特征与农业》的课件PPT大纲:自然环境概述 •地理位置和范围 •地形、气候和水系特点 •主要自然资源及其分布地形特征 •地形的种类和特点 •山区的开发利用和保护气候特征 •温度带和降水量的分布规律 •气候类型及特点 •气候变化的影响 智能生成课件大纲 智能生成课件配图 痛点 高校职能部门 接咨询压力大 行政部门通常由几位老师负责与整个学院甚至整个学校的师生对接。在5*8以外的时间服务空缺、响应及时性难以保障。 服务质量不高 举例,从《2023中国大学生满意度调查报告》中可知,目前中国2000多所高校学生仅有23.1%的学生对学校总体满意度 为非常满意。 沟通成本高 学生和老师相关信息,更多还是通过微信、企微等方式传递,要去回溯相关信息时成本较高,且容易出现漏信息、信息不对齐的情况 效率低下 高校行政部门的组织架构复杂,工作流程繁琐,工作效率较低。学生办事时存在多环节审核和审批,行政流程效率较低。 .... 科研部门 国际交流部门 党委组织部门 科研部门 后勤部门 学生工作部门 教务部门 场景示例 事实性提问 流程咨询 业务办理 关于办理出国成绩单的? 你是希望打印纸质出国成绩单还是通过邮件收取电⼦成绩单? 能够打印纸质成绩单最好 好的,以下给你推荐打印出国成绩单的办事指南链接。地址:xx⼤学国际交流中⼼,服 务时间:9:00-17:00 你希望了解出国留学的哪些⽅ ⾯呢? 如何准备出国留学申请? 今年在⼴东省录取⼈数为123 ⼈。其中通过⾼考统招计划招 ⽣111⼈,实际投档111⼈。其中,普通批物理类录取97⼈,包括5个中外合作办学。历史类录取8⼈,艺术类录取6⼈ 今年在⼴东省的录取⼈数有多少? 你能帮我预约今天下午3点的窗⼝服务吗? 好的,请确认预约信息:xxx,周三15:00,国际交流中 ⼼3号窗⼝,预约打印出国成绩单