您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华为&清华大学]:AI终端白皮书:AI与人协作、服务于人 - 发现报告
当前位置:首页/行业研究/报告详情/

AI终端白皮书:AI与人协作、服务于人

AI智能总结
查看更多
AI终端白皮书:AI与人协作、服务于人

"*̻ϧࡼ҉Ƞ᰺ߎλϧ "*㏵〜⮪⯛Γ AI与人协作、服务于人AI终端白皮书序言 AI与人协作、服务于人AI终端白皮书序言 AI与人协作、服务于人AI终端白皮书序言 AI与人协作、服务于人AI终端白皮书序言 AI与人协作、服务于人AI终端白皮书序言 AI与人协作、服务于人AI终端白皮书序言 AI与人协作、服务于人AI终端白皮书序言 AI与人协作、服务于人AI终端白皮书序言 AI与人协作、服务于人AI终端白皮书前言 Ғᝓ FOREWORD ϧጒᮧ㘪喍ASUJGJDJBM*OUFMMJHFODF喎᭜ᠴ̭ㆨᎬ∈⮱ឭᱜ喑ᬕౕប㵹ᝃ䒲ߖႹ᜽Вݺग㘪⩞ϧㆨᮧ㘪Ⴙ᜽⮱䃑ⴒШߎȡⰛݺ喑๔็᪝ϧጒᮧ㘪㈨㐌䘪᭜ധλᱧக႓΍喍MBDIJOFLFBSOJOH喎ឭᱜ჋⣝⮱ȡᱧக႓΍᭜̭㈨݄䕇䓴ౕ๔㻱὎᪝ᢛ䯳̷䃚㏰⮱ឭᱜ喑Ҭϧጒᮧ㘪὎ಸ㘪์Ą႓΍”㐌䃎ᣕ᫚喑ᎣᏁ⩕䔆ψ὎ಸᲒ䶱≸Ⱕڠ䬛䷅⮱めᵵȡ ౕ䓴ࣨ⮱࡮็Ꭱ͚喑䃥็ϧጒᮧ㘪ឭᱜጟ㏼䔽⌽᜽⛌ౝᏁ⩕λ⊵䉦㔲㏵〜ϔ৮͚喑Ҹຯ喑जВ䕇䓴ᠴ㏦䃳ݘȠϧ㙥䃳ݘᲒ㼐䨮䃫ิ喑ᝃ᭜ϻఫ׼͚᣽ः᪴᱙喑Ꭳजᄳڣ㔨䃾̺ͧह⮱䄚㼭喑ᝃ᭜䃳ݘϧㆨキࢂ⮱䄚䴠ᠴБᎣប㵹䃫ิ᧺҉喑ᝃ᭜ധλ↪䒓̷ऱ⻺эᙌக䛴䯳⮱᪝ᢛ䔈㵹䒲ߖ侫侣ᝃ㜗ߕ侫侣ȡ 䓾ᎡᲒ喑Ą⩌᜽ᐼA*”䔆̭ឭᱜःᓄγᑂϧ∕Ⱋ⮱䔈ᆂ喑ຯ≮㵹⮱$IBU(15Ƞ(FNJOJȠ $MBVEFȠⰅऑȠ᪴ᓰ̭㼭Ƞ䕇Ͷࡰ䬛Ƞ䃜下ᭌ▘Ƞ$IBU(LMぶȡ䔆ψ὎ಸധλ๔ಸฺᱯ⮱⌞Ꮣ ⺋㏼㑾㐉㐀Ჱ喑䛴⩕ο㖁㑾̷⊤䛼⮱᪝ᢛ䃚㏰喑Ꭳ䒲В๔䛼⮱ϧጒࣺ亵ᄦ὎ಸ䔈㵹хࡃহᩦ䔈喑 ᰭ㏵䃚㏰ܧڤᰶ᪝࡮Ϭ⩇㜠᪝̴Ϭ࣯͗᪝⮱὎ಸȡऄ⯷λ⊤䛼᪝ᢛȠ⊤䛼࣯᪝Ƞ⊤䛼ツ߈⮱Ą㻱 ὎Ⴧᒸ喍TDBMJOHMBX喎”喑⩌᜽ᐼA*ڤᰶᰡສ⮱㶕䓫㘪߈হᰡ∈ࡃ⮱Шߎ㘪߈ȡ ⩌᜽ᐼA*䛺ൾγ⩌ϔ߈喑ᄳౕڲღ݈҉Ƞ䒜УᐭࣾȠ᪆㗟ߋڙぶ็͗䶳ഌ๔๔᣽ࡴϧЙ⮱ጒ ҉᩵⢴ȡहᬣ喑⩌᜽ᐼA*䔅ᄳ䉸εᮛ䕇ϧĄ䊲㘪߈”喑ᝡ̷ڤิA*㘪߈⮱ज⾬ᝡ䃫ิ喑⃼͗ϧ䘪जВ᠒ᰶ䔉䊲ϧㆨ➖⤳ᙌჅ㇫ᏓȠ䃝ᓳ᩵⢴Ƞ䌕䄚㼭㔨䃾ぶ㘪߈ȡₑใ喑⩞λ⩌᜽ᐼA*ᑧ๔⮱Ą⩌᜽”㘪߈喑㘪์㜗ߕ⩌᜽ऱ⻺ڲღ喑ຯ᪴ႄȠఫ׼Ƞ䴠ͽহ㻳䶾喑๔๔ౝ䭺ѻγऱ⻺Шߎ⮱ ݈҉䬕Ἀ喑⃼͗ϧ䘪जВ䔈㵹㞧ᱜ䃫䃎Ƞᐭࣾ⼸Ꮌ喑⩇㜠⠙⿸ݣ҉⩢ᒞহᄼ⍥᜼ȡᆂ᱈᱗Გ喑᜾Йₐౕ䔈ڒA*ൾ䕍᫝⮱⩌ϔ᫦ᐼȠ⩌≨὎ᐼВࣷᕊ㐡᫦ᐼ⮱̓⩹喑᪝ႄࡃȠᮧ 㘪ࡃ⹫чₐౕߍ䕌ݝᲒ喑〆ౕ䔆̭अ䲖⮱ݺ⇬喑᜾ЙᄳВ㵹䌢㼭喑䃖⃼͗ϧᢹᤎA*⮱߈䛼喑Ҁ侹 ឭᱜअ䲖ፓᲒ⮱⩌ϔ߈হ⩌≨䉕䛼⮱下䋰ȡ 01 ᄬै CONTENTS ϔ͇䊸߬01 1.1A*ឭᱜౕ㏵〜ϔ৮⮱㲺ڒᏓ䔽ₒ⌞ࡃ喑ᣕߕᕔ㘪̻Ҁ03 侹ࣹ䛺ࡴ㏔ 1.2ᮧ㘪Ҁᄳᑂ䶳㏵〜䔈ڒڕ᫝ϧᱧϑοࣷᮧ㘪ࡼ҉⮱ᬣА05 1.2.1็὎ᔮ๔὎ಸፓᲒᰡ㜗♣Ƞᰡڕ䲏⮱ϧᱧϑοҀ侹05 1.2.2A*㜗ͨࡃ⼸Ꮣ䊷Გ䊷倅喑ĄВᘼఫ͚ͧᓰ”⮱A*̻ϧࡼ҉06 ᫦ᐼₐౕᐧ⿸ 1.2.3๔὎ಸহᮧ㘪Ҁ侞ߕ̸̭Аᰡᮧᚔ⮱᧺҉㈨㐌07 1.3⊵䉦㔲䰭㺮ᰡߍᮧ㘪ࡃȠο㖁ࡃহϧᕔࡃ⮱ڕ౧ᮜᮧ09 㘪᰺ߎҀ侹 1.3.1็䃫ิȠ็౧ᮜ᜽ͧ⊵䉦㔲Ҭ⩕㏵〜䃫ิ⮱፥ᔮ09 1.3.2ڕ౧ᮜ䌕䃫ิ≮䒙⮱᰺ߎ䰭㺮ᰡߍ䒨䛼ࡃহӬᢤࡃ10 1.3.3A*侞ߕ⮱᰺ߎܳࣾ᣽ӈ᰺ߎ䔋㐚ᕔҀ侹喑Ჱᐧ᰺ߎܳࣾ᫝11 㠰ᐼ 1.4ᰡᑧ๔Ƞᰡ倅᩵⮱㏵〜ᮧ㘪䰭㺮កⵡ䃫ิহᏁ⩕䓦⩹12 1.4.1䒨䛼㏔㏵〜䃫ิ䯳᜽⩌᜽ᐼA*ߌ㘪ᄳ᜽ͧͨ≮12 1.4.2ധλ⩕ᝤ౧ᮜ⮱〜ξࡼहA*ᄳᲱまⱌₐᑧ๔⮱ڕᅭࡃᮧ㘪12 02 03 04 0$ ᱗Გ౧ᮜᆂ᱈14 2.1 ᆂ᱈̭ጒ҉ 15 2.2 ᆂ᱈ι⩌≨ 16 2.3 ᆂ᱈̶႓΍ 17 2.4 ᆂ᱈ఈཞͽ 18 A*㏵〜ᮧ㘪ࡃܳ㏔ᴴ۳̻ڠ䩛ឭᱜ➦ᒮ19 3.1A*㏵〜ᮧ㘪ࡃܳ㏔ᴴ۳20 3.2ڠ䩛ឭᱜ➦ᒮ21 3.2.1࣌⩌ᮧ㘪0421 3.2.2ڕ౧ᮜ㲺वᙌⴒ22 3.2.3㈨㐌䊲㏔ᮧ㘪Ҁ24 3.2.4〜ξࡼह25 3.2.5ႶڕजԎ26 3.2.6⩌ᔮᐭᩫ27 Վ䃛29 4.1ڞᐧA*㏵〜ᮧ㘪ࡃܳ㏔ᴴ۳Ҁ㈨喑➢ᑂϔ͇倅䉕䛼ࣾᆂ30 4.2卬㧆A*⩌ᔮᐭᩫࡼ҉喑ڞᐧڞ䊏31 ࣯㔰䉱᫆32 生成式AI对各行各业的产业提升效应是巨大的,行业研究数据表明,随着企业改变经营方式并对产品和服务进行强化,到2032年,生成式AI有望在硬件、软件、服务、广告、游戏等众多领域创造1.3万亿美元收入,占科技领域总支出从目前的不足1%扩大到10%-12%,复合年增长率达到约42%[1]。 而在生成式AI对消费者的影响方面,一项针对全球37个国家和地区的公众调查显示,2023年,认为人工智能将在未来三到五年内极大影响他们生活的人比例从60%上升到66%。此外,52%的人表示对人工智能的产品和服务感到紧张,比2022年上升了13%,36%的人认为在未来5年内,AI将取代自己的工作[2]。人们对AI充满了既爱又怕的矛盾,既认同AI能够改变世界,又担心AI取代人,人类变成了机器的仆人。 AI与人协作、服务于人,是华为终端一贯坚持的技术理念。正如计算机帮助人类提升生产效率、手机帮助人类让沟通无处不在一样,AI可以帮助人类突破自身身体局限,让自己看得更清、听得更清、记得更牢、理解得更透彻。同时,AI还能帮助人类增强、扩展信息的处理能力,面对海量信息,能够化繁为简,面对碎片信息,能够见微知著,面对无序信息,能够归纳推理。通过无处不在的全场景智能,华为终端致力于让AI帮助提升人的工作效率和生活品质,并赋予人们实现梦想 和创造未来的能力。 当前,生成式AI技术与消费终端的融合正在加速,不断推动行业创新和社会变革。华为终端与多家顶尖智库、研究机构及学术高校合作,通过深入调研和分析,总结出了四大终端AI产业发展趋势。 1.1 AI技术在终端产品的融入度逐步深化,推动性能与体验双重升级 AI技术在终端产品落地时,一般经历“应用层集成AI”、“系统层融合AI”、“以AI为中心的全新OS”三个阶段: Ꮑ⩕ᅯ䯳᜽A* (ࢂ◦➦ᕔ⮱ᮧ㘪෋ᑧ) ㈨㐌ᅯ㲺वAM (AM㘪߈̸↶喑侞ߕ04ᮧ㘪ࡃᩦ䕍) ВA*͚ͧᓰ⮱ڕ᫝04 (࣌⩌ᮧ㘪04᳣Ჱ) 阶段一,应用层集成AI:单点特性的智能增强,如在翻译,图片处理,文字识别等领域引入AI能力,以增强单点特性的功能体验。 阶段二,系统层融合AI:AI能力全面下沉OS,为上层应用和服务提供开箱即用的原子化、控件级AI能力。同时,对系统高频应用和服务进行智能化改造,如图片一键消除、图库检索、图片文字提取、日程自动生成等,提升OS系统的智能感。 阶段三,以AI为中心的全新OS:下一代原生智能OS架构,统一的AI子系统底座使得OS各个组件内部和彼此之间都能够灵活高效地使用AI技术;此外,内置于OS内的系统级AIAgent出现,使得原生智能OS不仅仅是一个操作系统,更是能够深度理解用户、自主闭环用户任务的、智慧的、常驻的超级智能体。 ࡻͧᠮ㐚ᑂ䶳A*Ҁ侹݈᫝ ㏵〜䃫ิ̷ࢂ◦➦ᕔ⮱ᮧ㘪෋ᑧ04ᮧ㘪ࡃᩦ䕍ᮧ㘪͚ͧᓰ⮱04᳣Ჱ 2016~2017 2018~2020 2021~2022 2023 2024~ ᐭड़.PCJMFA*ᬣА ͗ϧ㏵〜A*ࡃ ڕ౧ᮜ䃫ิA*ࡃ A*๔὎ಸ䉸㘪㏵〜 ڕ᫝࣌⩌ᮧ㘪04 ᥚ䒪⺋㏼㑾㐉ั⤳ࢂٰA*ᮧᚔᒞ׼ A*㔨䃾A*ᚔⱩ䃳➖A*㜗៺A*倅Ժअ♓A*ᑂ᧻ ᮧᚔ䄚䴠 ᮧᚔ䃳ᅼ ᮧᚔ㻳㻶 )JA*㘪߈ᐭᩫᗲᮜᮧ㘪A*䯁⾧᧺ᣔA*ᮧᙌᩜЅA*ԎᖜԊ៑A*ႄᎂ ᮧ㘪Ꮤ㝞 䄚䴠ߖ᝸㺳Ⰳڕ౧ᮜ䃫ิᄼ㞧ᐧ䃛 ᮧᚔᅼ/ᮧ㘪Ꮤ㝞ज㻳ज䄡็䃫ิࡼहੑ䚿 ᣒڒ๔὎ಸ⮱ڕ᫝ᄼ㞧倅䭣ᮧ㘪侫侣 ᮧᚔ᥉ఫ ᪴ᶐᦅ㺮 ⚔❴A*ξ෋ᑧ 㐌一A*㈨㐌ᏂᏔᄼ㞧䊲㏔ᮧ㘪Ҁ ࣌⩌ᮧ㘪Ꮑ⩕ڕ䲏ᐭᩫA*⩌ᔮ 以华为终端为例,在历经三个阶段的终端AI能力进阶后,将实现系统级原生智能,开启全场景智能新时代。 ·实时在线的服务:系统级入口和全局可用的超级智能体,实现智能服务无处不在。 ·更自然的多模态交互:基于LUI(LanguageUserInterface,自然语言用户接口) 与GUI(GraphicalUserInterface,图形化用户接口)相结合的交互和反馈,多维度识别用户意图,让用户更便捷地使用智能服务。 ·全场景智能体验:通过端云协同、AI+元服务的全场景智能,在生活、办公、出行、 创作等全场景领域为用户提供个性化、超预期的创新服务。 ·全面开放的AI生态:从开放AISDK/API、到开放高阶AI服务、再到开放Agent 开发平台和开放Agent应用市场,助力提升每一个终端应用的AI浓度。 1.2 智能体将引领终端进入全新人机交互及智能协作的时代 1.2.1多模态大模型带来更自然、更全面的人机交互体验 模态是指承载信息的模式或方式,不同类别的信息来源或形式都可以称为一种模态。模态基于人的感官可分为听觉、视觉、嗅觉、味觉、触觉,基于信息传递的媒介可分为图像、语音、视频、文本等,除此之外还有传感器的模态数据,如雷达、红外、GPS、加速度计等各种模态数据。人类生活在一个由多种模态信息构成的世界,会同时收到多个互补的、融合的、不同模态的感官输入,多模态更符合人类感知周边、探索世界的方式。 ᥱ׼๡ ᝸ۆぁ ᅼᎂ យฝக 叓ٸ䷻ ᪴У/྿Ҁ≮ 䓀ڒ∂ 㑾䶢/AQQ ᪴᱙ ฝ䴠 ఫ׼ ❵䲏㐀Ჱ ᪴ᶐఫ㶕 ڣЃฝ䴠 䴠ͽ 䄚䴠喍็䄚㼭喎 䲋㐀Ჱࡃ᪴᱙ 㐀Ჱࡃ᪴᱙ 䄚㼭(͚=㠞=...) ็὎ᔮ⤳㼐๔὎ಸ 生成式AI为终端设备带来更自然、更全面、更多维的人机交互方式,打破了传统单一独立I/O通道输入方式的限制,极大地丰富了人机交互的维度。多模态理解大模型可以让用户使用文本、图像、声音、视频、传感等多种数据类型与终端进行交流,大大拓展了用户同终端的交互形式。多模态生成大模型能够生成各种跨媒体内容,为用户提供更为直观的信息表达,从而实现更加高效丰富的沟通体验。这也为更多样性的终端硬件形态如穿戴设备、机器人等提供了更有力的支撑。 эᙌக 㻳䶾 эᙌ ⩌⤳Ԏतぶ ⩕ᝤ/䃫ิ⟣ᔮ (14/10* ⍥᜼/ч䃛ᒂᅼ ⣝჋㻳䶾 ߕ⩨ ⚔❴/᝸㐅ఫ ็὎ᔮ⩌᜽๔὎ಸ ᙌⴒ⎽/Ԏᖜ⎽὎ᔮㆨಸ 华为HarmonyOS通过其分布式软总线的通信协同能力,实现了多设备、全场景下的无缝连接,此外,HarmonyOS充分利用其丰富的硬件传感和软件感知能力,结合AI意图框架、语言大模型、多模态大模型,深入理解用户意图和当前所处场景的上下文,为用户提供触摸、手势、语音、眼动、自然语言、图像等更自然、更全面、更贴合使用习惯的交互体验。 1.2.2AI自主化程度越来越高,“以意图为中心”的AI与人协作方式正在建立 目前,基于生成式AI的LLM(LargeLanguageModel,大语言模型)在自然语言理解、推理、思维链等能力上取得的突破性进展,受益于此,AI完成任务的能力越来越强,从简单指令执行,演进到自主拆解目标并自主完成任务的高阶智能体。 “Agent”(智能体)这一概念起源于哲学,描述了一种拥有欲望、信念、意图以及采取行动能力的实体。基于LLM的AIAgent更多是指“一种智能体,可以自主地理解意图、规划决策、执行任务、调用工具,并具有记忆能力。”AIAgent的出现,意味着AI与人的协作方式将发生颠覆性变化,从传统的“以用户指令为中心”,转变到“以用户意图为中心”。 ϧᠴᄩA*Ⴙ᜽Шߎ A*ౕϧㆨᠴᄩ̸Ⴙ᜽Шߎ ϧ⯾ⲐA* A*㜗ͨܳ㼐Ⱋᴴ喑Ⴙ᜽Шߎ A*᭜ጒڤ ϧ䄰⩕A*喑๔䘕ܳጒ҉⩞ϧႹ᜽ Вᘼఫ͚ͧᓰ ВᠴБ͚ͧᓰ “以意图为中心”是一种提升用户体验的设计理念:用户只需要表达出需求或期望,而将实现需求的过程交由系统来完成。 以手机为例,当用户希望在飞行途中继续观看视频剧集,早些时候,他只能自己告诉手机上的AI智慧助手逐步执行“打开华为视频”、“找到xx视频”、“下载第5~8集”等操作。但在以