穿越智算奇点 解锁大模型的无限可能 (本材料所有文本,插图,均由A/自动生成 腾讯云秦若教 2024.6 目CONTENT 01 大模型的 基础概念 02 大模型的 关键技术 03 大模型的 典型应用 04 大模型的 未来发展 01 >他来了!他来了! 他脚踏祥云走来了! 大模型的基础概念 你的新伙伴已经上线 你在和一个智能系统约会,那是什么感觉? 2013年电影《HER(触不到的她)》 商汤日日新 ChatGLM 腾讯混元 360智脑 安通义大模型 文心一言 Kimi智能助手 川百川智能 LICHUANAI Gemini ChatGPT DALL-E3 ANTHROPIC Midjourney stability.ai MMetaAl MISTRAL AI_ 参数规模大:大于1,000,000,000,000个参数 数据需求大:大于12个牛津图书馆 资源消耗大:单次训练需耗费1.5亿人民币 大模型有多“大"” 你从哪里来?我的朋友大模型的历史脉络 1950人工智能的起源1956早期的探索: 人工得能概念最早可追溯到20世纪40年代和50年代1956年的达特茅斯会议,“人工智能"被正式提出 1950年,阿兰图灵提出图灵测试早期的AI研究集中在基于规则的系统和专家系统 1990神经网络的兴起与衰退:2006机器学习的复兴: 20世纪60年代至80年代,神经网络开始受到关注21世纪,机器学习开始迅速发展 由于算力和数据的限制,神经网络在90年代初遭遇低谷2006年,杰册里辛额等人提出“深度学习“概念 2012大模型的诞生:2017Transformer(转换器)架构的革命:2012年,AlexNet实现图像识别领域的突破、2017年,谷歌提山Transformer架构 随后,大模型开始在各个领域展现出其强大的能力,Transformer渠构为后续大模型的发展提供关键支撑 2022预训练模型的兴起:NOW多模态模型的探索 GPT等预训练模型出现,在语言任务领域取得突破探索将文本、图像、声音等多种模态数据融合的大模型预训练模型通过大量文本数据训练,能够更好地理解和多模态模型为创意、娱乐、教育等领域提供新的可能性生成自然语言 Claude3 “千万里,我追寻着你”国际大模型的创新浪潮 MMeta Llama3 Meta于2024年4月发布 开源,应用非常广泛 Midjourney 专注于图像生成的AI模型 艺术创作、设计领域 Claude3.5 语言模型 视觉模型 Dall-E3 Anthropic于2024年6月发布 多榄态能力、非英语语言处理 OpenAl开发,文生图的先驱 图像细节、多样性表现 GPT-40 OpenAl的最新多模态模型 更商的参数蛋,当前最强大模型 StableDiffusion 开源的文生图大模型 开源、可控生成、模型多样性 中国欢迎你,为你开天辟地”:国内大模型的极速崛起 01 腾讯混元:多模态智能的领跑者 2024年5月,发布元宝、开源中文文生阁模型 应用:戏,杜交、广告等场灵 04 月之暗面Kimi长文理解的先驱 2024年3月,放支持200万字超长文本 应用:长文本理解、名能写作等 件..F.I2出. 02 阿里通义千间:电商智能的新篇章 2024年6月,开源QWEN2 应用:电商与营销领战的智能化 通义千间 05 智谱清言:分析与编程的高手 2024年6月,开源GLM-4-8B 应用:f代码生成、Excal分析缩写 Q智谱清言 ChatGLM 数超分行 03 百度文心一言:探索知识的深海 2023年10月,发布文心一言4.0 应用:在线搜索,知识问答、学研究 文心一 WWEBotJ 06 百川百小应:会提的小助手 ·2024年5月,发布*古小应"APP 应用:通过主动追问,引导月户提出需求 D.+i-+tY 部分GPT-4基准测试结果 HuanAvg.GPT-4 100 mm USABC* UnitomEar SAT Advanced WineGrarde ExaY Scmmeliar (commonserse) GPT4的考试成绩远超人类均值 美国生物奥林匹克竞赛:超过99%考生美国律师资格考试:超过90%考生 美国高考:1410/600(写作+数学) AI生成作品在人类艺术竞赛获奖 2022.10美国科罗拉多州年度艺术竞赛 Midjoumey生成的作品获得蓝丝带奖 你是电,你是光,你是唯一的神话” 02 刷题不刷万亿遍 哪敢自称学霸? 大模型的关键技术 书架 大脑 心脏 书桌 作业本 学霸的书架:海量训练数据 GPT4共学习13万亿token的洲练数据、类似子读完5200万本《唐持三百首》 熟读唐诗三百首 不会作诗也会 数据 采集 数据 清洗 数据标注 数据融合 数据 增强 02模型规模与性能:规模的力量 基底大模型的性能与规模密切相关 当前最大规模:GPT4,1.8万亿参数 书架 大脑 心脏 书桌 作业本 学霸的大脑:基底大模型(FoundationModel) 01 基底大模型的定义:智能的基石 通常具有数十亿其至数方亿的参数 基底人模型为智能系统提供基础能力 oo 03 模型压缩:效率与性能的平衡 压缩模型,以减少模型的算力需求 、技术:知识蒸馅、迁移、剪枝 书架 大脑 心脏 书桌 作业本 学霸的心脏:智算底座 高性能集群 ·GPU组成的大规模并行计算集群 ,要点:并行处理、高速互联、资源调度 高性能网络 ·0.1%的掉包,会损失50%的算力 ,要点:低时延、高可靠 高性能存储 ·读写数据时,GPU资源处于等待状态 ■要点:快速读写、高吞吐,冷热分层 书架 大脑 心脏 书桌 作业本 学霸的书桌:训练平台 资源优化与训练效率提升 ,简单堆机器,会导致分布式性能反降 ·优化算法,提高资源利用率,提升推理训练速度 点 一站式服务的训练平台 ,功能:模型选型,训练共建、部署应用 训练方法:监督训练、人工反馈、强化学习 数据管理与模型版本控制 训练数据的准备、知识挖掘与增强、数据清洗与切块 *向虽库建设与维护、模型版本控制 书架 大脑 心脏 书桌 作业本 学霸的作业本:模型优化 模型精调:领域专家的塑造者 ,技术:针对特定任务或数据集进一步训练 ,日的:学习特定领域知识、提升专业任务表现应用举例:医疗行业,更好地理解电子健康记录 Finetunino PromntEnaineerind 提示工程:智能引导的艺术 ,技术:设计精确的输入提示来引导模型 :目的:在没有大量训练数据的情况下解决特定任务应用举例:教育行业,快速生成定制化学习材料 检索增强:获得实时的海量信息 oratior :技术:检索外部信息源,提供软助信息 :且的:提供更加精准,更加及时的信息应用举例:金融分析领城的智能投研助手 >你是我的阿拉丁神灯吗? 03 大模型的典型应用 通才或者专才:通用大模型与行业大模型 通用大模型 行业大模型 ,概念:捕捉通用特征,处理多种通用任务 构建方式:侧重于广泛的数据覆盖 训练月标:良好的泛化能力 ·场景举例:搜索引擎、语言翻译、内容推荐 VS 概念:针对特定行业定制,基丁通用大模型精调构建方式:侧重于特定领域数据的深度和质量训练目标:特定任务的性能 场景举例:医疗诊断、法律分析、金融风险评估 虚拟助理 ,日程管理 信息查询 智能家居控制 娱乐互动 ·虚拟陪伴 ·游戏角色 虚拟偶像 个性化智能:面向个人的大模型应用 辅助创作 ·文案创作 ·音乐创作 图像生成 个性化教育 ·语言学习 ·编程学习 ·知识问答 个性化智能:全球C端大模型应用概览 大模型赋能大模型原生市场已有产品数量>2300 搜素GGoogleBai爸百族 Search LNewBing [IPerplexity>150 会议市MicrosoftTearrs腾讯会议>20 文档腾讯文档DofficeVWPS>450 陪伴f DISCORS character.ai InflectionPi >150 ( 坏3ADUNGE&Ninworld>50 游戏王者荣耀网易术哈游 ReplikaLJLMNIMAX 个人助理 WindowsCopilot NRewind ADEPT 学习 X科态 duolingo 来源:腾讯研究院 >1000 >150 @A小奶于 X R 过去5分钟测了什么? 刷附讨论内客驾括: ,小郭介组限录会议认证产品合作速度,已收80款申请,20个初步通过,需复 测和优化,扩大理分场量围盖。 ,小林表示已达成25家合作晶滤,完成60%生态建设日标,需加强个人外设品牌合作。 小赵问国际晶牌合作,小郭提到已进行 三轮治读,关注得摄会议rooms系线和天路模组方案, 与会人员讨论合作跳战、优化认证流 程、提高产品质量和用户体验等问题。 内密出A生6 心 期说了什么总请会议更多闯题 输入 出 腾讯文档:智能起草 5智期手 国X 1:47 你好逸Ros,表量用文档高用 你可以尝试这样提问业文档起单 蒙志格生或潜设计收票表 中生成甲维寻亚 目选文档答 oti* #$+13 天涯明月刀:NPC 我喜 阿暖 基是好喝 浅窥智能生活:腾讯的C端大模型应用案例 腾讯会议:自动会议纪要 腾讯云智能:AI写真 企业智能化:面向企业的大模型应用 业务价值革新 生成式AI应用场景矩阵 横轴:企业业务流程(内部<=>外部) 纵轴:业务改造程度分类(改善<=>创新) 88四大场景价值象限详解企业内部流程外部用户体验 运营效率提升象限:内部用户降本增效客户体验提升象限:外部用户提升体验 产品价值创新象限:外部用户颠覆服务模式 业务流程重塑象限:内部用户/构内部流程 业务流程增强 企业智能化:大模型技术的行业渗透情况 日标市场渗透 100% 广告软件 教育 传媒 金融 出行 电商 %0 肆筑 发展阶段 探索孵化期 试验加速期 采纳成长期 落地成热期 来源:腾讯研究院,2024年初调研 企业智能化:AI百大应用场景 BRATR 地产 教育物业 泛互 .. 文旅 金融传媒 运营商生成式AI 应用场景盘点 -11322323 r医药政务 制造出行 R 零告能源 来源:腾讯云《生成式AI产业落地路径研究报告》ATE 运营效率提升:以金融行业落地案例为例 生成式AI应用场景渗透金融业务流程 企业内部流程生成式AI应用场景 IT代码助手 办公办公管理 营销个性化营销 运营(法务&人事&财务&行政)数据分析 IT业务流程优化办公业务流程简化营销业务流程赋能运营业务流程自动化 ,高信息化程度的金融机构会议纪要的白动生成,客户经理面对的产品知识序,定期向监管机构报送数据 ·牛成式AI铺斯代码补全,理解并准确生成专业术语·牛成式AI拱供快速问答,捐助获取分析数据与生成报告 ·如速APP研发送代速度,从流程中释放员工,节省学习理解产品的时间,对话式交互快速定位异常原因 客户体验提升:以医疗行业落地案例为例 “生成式AI应用场景渗透医疗服务流程 外部用户体验 生成式AI应用场景 诊前(售前) 智能导诊 诊中(售中) 检查报告自动生成 诊后(售后) 智能随访复诊 诊前环节优化 解决挂错诊室、医生不匹配等问题 生成式AI机器人协助忠者了解就诊科室 完成预约挂号与精准医生推荐 诊中环节辅助 忠者面对检查报告的困感 ·生成式AI提供医疗辅助诊断报告 :提升医生检查效率 诊后环节关怀 弥补诊后与医生的交互空缺 生成式AI随时解答忠者用药疑感 提醒用药,持续关心患者健康 大模型应用落地的三大路线 购买自建 1.标