大模型智能汽车的预见 万蕾博士 华为Fellou IASBU政策与标准专利部部长 2025.6.10 HUAWEI 目录 ·大模型技术趋势 大模型在智能汽车的潜在应用 。大模型与AI治理 HUAWEI 算力、算法和数据支撑人工智能发展 HUAWEI 全球互联网 万维网开放超10亿Iphone 数据发布 全球智能机 子 AI大模型改写和自燃语言连理 1991 2005 2007 超10亿 2013 全球有效专利推理 1400万全球联网汽车全球移动用户 同题国等对活机温人语必新所 关系提取 .. 195819892006201220162017 2018 2021 超3亿55亿句法分折 20222023实体刷文本分理解语言标签 神经网络用于图缘识刷深度学习兴起 算法提出CNN算法 GeoffreyHinton Google 深度学习 2022.12 知 OpenAl ChatGPT CLIP8DALL-E 自请语音识别 GPT-3 图像分类交破战胜人类文字转语育 2023 +计算计算 2017 云·端算力 谷A3起算: 194619651981 20022004 2006 2008 首个手机26EFLOPs AlSoC 计算NvidiaNvidia 云计算 诞生 计算机 分布式 IBM CUDA 首个AIGPU Moore's law PC机云存储计算并行计算 大模型使能人工智能快速进入认知智能阶段 4 基于逻辑和数据输入进行推理预测的智能 推理生成智能检索智能客服工业质检 产业应用智能推荐智能审核智能最入 HUAWEI 意图理解 理解语言、逻辑、知识的智能 规觉。听觉等感知的智能 原子能力 智能对话智能问答目标检测智能创作文档理解图像分割 精调 专业教育 智能感知精调 任务相关少量数据50808类似人类 学习机制 特定领域中规则明确的数据处理智能预训练 海量无标注数据自监督学习通识教育 智能计算文本知识图像视频 OPEN-AI大模型分层生态 HUAWEI 聊天搜素办公教育 OpenAl:ChatGPT微款:NewBing微款:MS365多邻国:DuoLingo 应用·题天机器人·提案常成GPT-4,提供 ·办公虚用集成GPT-4,提供·在线流膏学习,基于GPT 仅2月,用户数超1300万BingChatE Copilot3/e RolePlay 月活达1亿上线1月,日活达1亿,+Word,PPT,Outlook ·月清达6000万,420万为 ·Web&iOSAPP ?20美元/月 1/3新用户·部分试用,来正式开 ·暂不收费 ·30美元/月 ............. API问答、检测、翻译、文本理解、编排.. 精调CodexInstructGPTChatGPT 专业教育场景模型·120亿·13亿 ·增加人类对适语料 ·数十亿优质代码 ·语言指令+结构化数据 ?对语能力更强+安全结果 ·基于GPT-3,提升代 码生成 ·精简参数+降低开销·低开:GPT-3.5的1/10 GPT-1GPT-2GPT-3GPT-3.5GPT-4 -1.17亿·15亿·1750亿·1750亿?万亿级? 预训练基础模型·架将:Transfomer架将&训练:类GPT-1·架将&训练:美GPT-1·训练:指令学习+人类反馈强化 ·认练:重新训练。 并在奖 通识教育·谢练:无监督预练·数据:+webText网页?数据:海量亮质量数据,45TB网页 学习RLHF(GPT-3精调) 励模型加入规则 数据:BooksCorpus等·迁移:零样本学习数据过滤570GB,书籍,wiki等·数据:>7.7万人工标注?数据:+文本图片等 ·迁移:多任务有监督精调·能力:初步能力通现·迁移:少样本学习·迁移:零样本学习+少样本学习 ·迁移:同GPT-3.5 ·能力:尝试雅理,问客等阅读理解等·能力:In-contextLearming ChainofThought能力通现 ·能有力:用语真言生无成害与人类对齐, ?能力:支持多模态:文本最大长度扩展8倍 三个典型大模型演进历程 开源→闭源+开放API ChatGPT月活超1亿 ChatGPTAPI HUAWEI OpenAI 20182019.22020.5 开放GPT-3API$20/月$0.002/干token $0.02/干token 2022.112023.1~22023.3 GPT-1GPT-2GPT-32020.6发布ChatGPT微软推出发布GPT-4&API 1.17亿15亿1750亿 In-context Learning 5天突破100万New-Bing 32K上下文 $0.12/千token Google 20172018 发布 2022.4 闭源 发布API 集成到Gmail等办公产品 2023.5 发布BERT发布PaLM2023.3发布PaLM2 Transformer~1亿5400亿发布PaLM-E3400亿 ·注意力机制实现语言,推理code100语言,20编程语言 快速并行计算 ·位需编码引入全 厚上下文信惠 2023.2 ✲泊开源2023.3 发布LLaMA 4个舰格:70/130/330/650亿 2023.3 斯坦福发布Alpaca70亿参数 语言生成数据导等 3小时成本$600 ·适用于NLP ✲迫开源 生态形 MMeta LLaMA✲泄露 羊能家族 ChatGPT:大模型在自然语言应用中✁突破 HUAWEI ChatGPT提升✁核心点 1大→能力涌现模型规模大到一定程度后突然肤得高阶能力 简答任务如知识:随参数增长线性增加 模型参数很大,十亿~千亿量级复杂任务如推理:参数大于10B~100B后突然获得 ChatGPT人类意图①上下文理解 MostBreakthroughnessTasks 40 FigreofSpeechDetetion C连续对话①用户意图有效拥提 1758 65B PeriodcUleen ModifiedAitbmto +RepeutCopyLogic WiorldUnsa 剪法屏极?连续对话能力 1.3812B■ SPT- 910 OpenAIGooglkMeta6614+093-061-091E+10S4+1021-11 ParameterCount 2逻辑推理拟人→人类反馈✁强化学习 In-contextLearning ·Transformer采用注意力机制,在处理上下文关联性上比CNN表现更好。GPT-3GPT-3.5/ChatGPT ·训练数据中连续对活和代码含速合更多逐辑信息。存储了45TB知识不了解人类引入人类反馈&奖动机制 模型BERTGPT-3GPT-3.5 模型结构TransformerTransformerTransformer 注总力机制双向单间单间会写文章不知嘟些理解上下文 训陈方式遮盖和顶测自国归自国归会推理是人类认承认不知道 会编代码 书籍wiki书霜、网页、wiki,对话书籍、网页、wiki,代码、对话不会聊天 可✁答案 政于质疑 能连续对活 Microsoft:与openAi✁深度绑定 HUAWEI 微软一方面牢牢地将OpenAI绑定在自己✁云服务平台,另一方面利用ChatGPT深度赋能自己旗下所有产品 消费者生态办公智能化企业数智化开发者生态 控制浏览器就是控制流量入口Copilot集成进Widows,升级·生成式A技术引入商业应用 AI办公助手智能水平提供面向销售、客服、市场 帮助开发者构建自己✁Copilot打遥Copilot和Plugin两种生态模式 bBing 运维和供应链✁A工具Copil TE用DyTmics365免mutm 必应成为ChatGPT默认✲索引擎 自动生成ppt,word,excel,用于CRM、ERP等 构建全生命周期低成本AI开发工具 以AzureOpenAlservice为基础提供 统一开发框架和开发流水线 MicrosoftFabric Copilot集成进windows,升Teams:团队协作,如语音转写·Vivasales:A握升销售✁工 级A助手✁智能水平,加强PC自动生成会议纪要:实时内容作效率,场景化前件生成, 市场OS✁统治地位摘要生成等:如定价:及客户跟进等 提供AI时代✁数据平台LLM赋能,用白然语言交互满足数据分析需求,留存用户生态数露 PaLM-E:大模型使能EmbodiedAl 谷歌开始第二步和第三步✁尝试 HUAWEI 史上最大“通才”:PaLM-E模型看图、i说话、还能操控机器人 PaLM-E2023年3月8号发布通用AI✁愿景 EmbodiedMultimodalLanguageModel 多模态具身语言模型(VLM) PaLM Tuning PaLM-E 模型能力冻结,抗速忘与损害,让 单一✁多功能模型应用在不同场景。 交织 真实世界观察多模态串行 图像/状志/传票 Token 久量 ,5620亿个参数基于PaLMLM 问题:在图1和图2之闯到底语言能力基本没有下降 成就理解图形发生了什么?成就二非冻结模型如何减 自主学习理解/生成语言三日1:可联量一个回落 少遇忘✁第二条路 操控机器人 结合图形和语言理解,生成机自月2:可教能力冻结 器人指令,处理物理世界任务 径:加大参数量 启示操作机器人能力在语言大模型中涌现,且不损失语言和视觉能力 大模型改变应用开发范式 HUAWEI 小模型:作坊式AI 从0开始独立调优→艰难送代推倒重来 大模型:工业化AI 预训炼+精调 一个场累一个模型数据质量差、样本少 模型精度差 多个场一个模型 数据自动生成/增广模型精确鲁棒 开发周期月级 开发周期天级 大模型:规模化生产高性能AI模型✁产线原子能力产业应用 工业化开发场晨1 模型1-n API 智能对话智能检索 预训练+下游任务微调流水线 智能答智能客服 大模型应用 场量20 模型1-n 流水线目标检测工业质检 INE模型1-n智能创作智能推荐 滤水线 基础大模型场景化模型 文档理解智能审核 用开发范式 预练微调&部署图像分割智能录入 送代 大模型应用:行业领域 NLP大模型CV大模型多模态大模型计算决策大模型 a■案件复议服装生成?1节电预测 1仓库监控1图文检索1异常财务检测 1智能投研工地Re-ID黄1电力邀检1拥堵预测 CV大模型4.9亿27亿 合通过绘器销入特家应或其值场所复制到虚拟世界。 业HUAWEI 分析2D绘图✁物体结构、总义和排列,创建交互式 数字字生家庭3D字生空间 中国家腔数全球家脑数 根据输入面留照片创建3D头像网格并染CV大模型160万人550万人 3D人验建模中国0.1%渗透率全球0.1%渗透率 基于高频信息适配合适✁3D面部表情CV+NLP大提型160万人550万人 唐拟人微表情中国0.1%游透率全球0.1%添透率 通过可穿截设备监控宠物,分析完物行为NLP增激模型2.2亿4.7亿 完物动作分析中国宠费数量全球宠物购 食物检测 从图像中检测合物,对其说期、分类、提配、警示多模志大模型 42万人 全球每年死于食物中毒 通过监控摄像头、手机摄像头监控环境,并形成报CV+NLP模型10亿100% 环境临控和报告告、警示、安全分析全球监控摄像头手机石置摄像头渗透率 113:$68823758R 目录 ·大模型技术趋势 ·大模型在智能汽车✁潜在应用 ·大模型与AI治理 业HUAWEI 大模型催熟AIGC→智能座舱&智能驾驶HUAWEI 能 智计算决策大模型 舱座 策略生成 智能驾驶 ·智能交互:影音、AR、车机/手机无缝切换自主拆理决集,提出解决方案·ADS训陈:复杂场景生成,自动化标注 ·信恩检索,意图理解,内容生成,智能控制·人机共驾/影子驾驶:智能算法选代升级 音频生成 文本生成特定语音,语意克隆,膏乐生成 3D生成 为小艺 游戏模 型 GameAl 数字字生SyntheticVoic 虚拟现实本等素材生成 RESEMBLEAI 图像生成 WELLSAD 视频生成 文字/图像相互转换 代码生成视频