您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国盛证券]:智能助理:苹果入局 - 发现报告
当前位置:首页/行业研究/报告详情/

智能助理:苹果入局

信息技术2023-09-10刘高畅国盛证券丁***
AI智能总结
查看更多
智能助理:苹果入局

苹果增加支出开发对话式人工智能,Siri有望朝智能助理迈进。据The Information报道,苹果正增加支出开发对话式人工智能,其目标之一是开 发一些允许iPhone客户使用简单的语音命令来自动化涉及多个步骤的任务 的功能,例如让Siri语音助手使用他们拍摄的最后五张照片创建GIF,并将 其发送给朋友。除苹果外,海外不断有科技厂商将大模型与各类应用打通推 出智能助理产品:1)人工智能初创公司HyperWrite推出了定位为个人AI 助手的谷歌浏览器插件,可以操作众多网站,包括Google Docs、Gmail、 Outlook、Notion等,轻松处理用户的日常任务。2)Zapier是一个工作流程 自动化平台,可以连接数千种最流行的应用程序和服务来帮助用户完成任 务,Zapier让用户可以将OpenAI的模型(GPT-3、DALL-E、Whisper)连 接到6000多个应用程序来自动化各种工作,无需任何代码。 OpenAI推出ChatGPT企业版,利好智能助理落地办公场景。8月28日, OpenAI宣布推出ChatGPT Enterprise,提供企业级安全和隐私、无限的高 速GPT-4访问、用于处理更长输入的更长上下文窗口、高级数据分析功能、 自定义选项等等。OpenAI官网称ChatGPT Enterprise的发布标志着人工智 能工作助手又向前迈进了一步,它可以帮助完成任何任务,为用户的组织定 制化,并保护用户的公司数据。我们认为,ChatGPT Enterprise的推出解决 了在办公领域的安全隐私问题以及对模型的性能要求问题,利好智能助理在 办公场景的加速落地。 规划+记忆+工具使用,AI Agent助力智能助理生态构建。AIAgent即人 工智能体,以大模型为核心驱动力,在此基础上增加了规划、记忆和工具使 用三个关键组件,以提高大模型在面对复杂任务时的处理能力。智能助理与 用户进行自然语言交互以协助完成各种任务,可以认为是AIAgent的一个 子集。我们认为智能助理是最能展现大语言模型优势的超级应用之一,AI Agent则是实现智能助理的关键技术路径。AI Agent的能力核心在GPT为 代表的LLM,但LLM在更新新信息、处理多轮对话,和面对复杂任务时依 然存在局限。AI Agent通过增加规划、记忆和工具使用三大能力克服了这些 局限,极大扩展了大语言模型的应用范围,使其能够胜任更加复杂的任务, 这为AI Agent扮演智能助理的角色提供了可能。耳机、手机、音箱等智能 硬件将是近期智能助理的核心终端载体,智能硬件厂商通过实现软硬一体智 能助理有望获取更大价值。 建议关注: 智能助理(耳机/手机/音箱):漫步者、科大讯飞、传音控股、中科创达。 风险提示:AI技术迭代不及预期风险;经济下行超预期风险;行业竞争加 剧风险。 一、苹果增加支出开发对话式人工智能,Siri有望朝智能助理迈进 9月6日,据科技媒体The Information报道,苹果正增加支出开发对话式人工智能。 苹果公司已经将其用于AI计算的预算扩大到每天数百万美元,其目标之一是开发一些允许iPhone客户使用简单的语音命令来自动化涉及多个步骤的任务的功能。例如这项技术可以让人们告诉手机上的Siri语音助手使用他们拍摄的最后五张照片创建GIF,并将其发送给朋友,目前iPhone用户必须手动对各个操作进行编程才能完成。 此前在7月19日,彭博社报道苹果正在内部开发自己的类ChatGPT AI聊天机器人,一些工程师直接简明扼要地将其称之为“AppleGPT”。我们认为大模型有望提升Siri能力,同时APP Store的生态很容易让未来更智能的Siri与各应用打通,调用各类应用实现不同功能,从功能简单的语音助手成为强大的智能助理。 除苹果外,海外不断有科技厂商通过将大模型与各种应用打通推出智能助理产品: 1)人工智能初创公司HyperWrite推出了定位为个人AI助手的谷歌浏览器插件HyperWrite-AI Assitant。Hyper Write的CEO在推特中表示这是第一个可以像人类一样操作浏览器的AI Agent。生成式AI企业Cohere联合创始人兼CEO Aidan Gome回复:我们将开始第一次看到真正的“个人AI助理”。 图表1:Aidan Gomez推特 HyperWrite-AI Assitant是一个可以可以操作浏览器的AI Agent,其底层使用类似于ChatGPT的模型,但超越了简单的聊天机器人,它是一款多功能工具,专为日常任务和高级工作需求而设计。HyperWrite插件通过谷歌浏览器可以操作众多网站,包括Google Docs、Gmail、Outlook、Notion等,可以轻松处理用户的日常任务。从管理Gmail邮件到预订航班、订餐或在LinkedIn上寻找候选人,用户可以将数小时的乏味工作转变为一个命令。HyperWrite可以起草专业电子邮件、生成原创内容并在键入时接收上下文感知建议,借助HyperWrite的高级个性化功能,可以让写作内容保持用户的风格。 图表2:HyperWrite插件可以链接各类网站协助用户完成工作 2)Zapier是一个工作流程自动化平台,可以连接数千种最流行的应用程序和服务来帮助用户完成任务,Zapier让用户可以将OpenAI的模型(GPT-3、DALL-E、Whisper)连接到6000多个应用程序,这样用户就可以自动化各种工作,无需任何代码。 图表3:Zapier可以将OpenAI模型连接到超过6000个应用 二、OpenAI推出ChatGPT企业版,利好智能助理落地办公场景 8月28日,OpenAI宣布推出ChatGPTEnterprise,提供企业级安全和隐私、无限的高速GPT-4访问、用于处理更长输入的更长上下文窗口、高级数据分析功能、自定义选项等等。OpenAI官网称ChatGPTEnterprise的发布标志着人工智能工作助手又向前迈进了一步,它可以帮助完成任何任务,为用户的组织定制,并保护用户的公司数据。 OpenAI称ChatGPTEnterprise是迄今为止最强大的ChatGPT版本,具有以下特点: 1、企业级安全和隐私: -客户提示和公司数据不用于训练OpenAI模型。 -静态数据加密(AES 256)和传输中数据加密(TLS 1.2+)。 -经认证符合美国注册会计师协会(AICPA)的SOC 2标准。 图表4:ChatGPT Enterprise符合SOC2标准,能处理敏感数据 2、适合大规模部署的功能 -具有批量会员管理功能的管理控制台。 -单点登录。 -域名验证。 -用于了解使用情况的分析仪表板。 图表5:ChatGPTEnterprise分析仪表板 3、快速、无上限的访问GPT-4 -无限制、高速访问GPT-4和高级数据分析。 -32k长度token的上下文窗口。 -可共享的聊天模板,供公司协作和构建工作流程。 我们认为,ChatGPTEnterprise的推出解决了在办公领域的安全隐私问题以及对模型的性能要求问题,利好智能助理在办公场景的加速落地。 三、规划+记忆+工具使用,AI Agent助力智能助理生态构建 AI Agent即人工智能体,以大模型为核心驱动力,在此基础上增加了规划(Planning)、记忆(Memory)和工具使用(Tool Use)三个关键组件,以提高大模型在面对复杂任务时的处理能力。 图表6:基于大模型的AI Agent系统流程图 智能助理可以看作是一类面向服务、交互的AI Agent。智能助理利用大语言模型等人工智能技术来实现智能对话和协助服务,用于与用户进行自然语言交互以协助完成各种任务,可以认为是AI Agent的一个子集。与一般的AI Agent不同,智能助理的特别之处在于: 1.应用领域上,智能助理通常更侧重于日常任务和生活辅助,如日程管理、消费娱乐等,主要面向终端用户。而AI代理可在企业内部使用,应用于更广泛的领域,如数据分析、自动交易、工业自动化等。 2.交互性上,智能助理通常更注重与用户的交互,需要要设计得相对简单,易于使用,主要以语音交互为主,而其他类型的AI代理可能涉及更复杂的功能,可能更多地运行在后台,与用户的直接交互较少。 我们认为,智能助理是最能展现大语言模型优势的的超级应用之一,AI Agent则是实现智能助理的关键技术路径。从原理上说,AI Agent的核心能力来源于是类似ChatGPT的预训练大语言模型。但仅仅依靠大语言模型还不够,为了使AI Agent能够完成更复杂的任务,还需要增加规划、记忆和工具使用等关键能力。GPT为代表的LLM已经展现出强大的语言理解生成能力,但仍存在一些局限。首先,LLM的模型难以即使基于新信息进行调整;其次,LLM难以记住多轮对话的上下文信息,最后,LLM处理复杂任务也较为困难。AI Agent通过增加规划、记忆和工具使用三大能力克服了这些局限。规划能力可以将复杂任务进行拆解,使之成为语言模型也能处理的简单子任务。记忆能力帮助语言模型记住关键信息。而工具使用能力可以调用外部工具,以弥补语言模型的能力缺口。 AI Agent通过这三大能力极大扩展了大语言模型的应用范围,使其能够胜任更加复杂的任务。它们与人类任务执行的方式也异曲同工,都需要任务拆解、信息存储和工具辅助,这为AI Agent扮演智能助理的角色提供了可能。 智能助理的终端需要软硬件一体实现。目前受限于算力,轻便的硬件终端难以运行较大的模型,因此短期内智能助理背后的大模型还是会部署在云端,但是终端也需要软硬件一体的实现,承载智能助理的部分功能,例如语音识别、接入大模型的众多应用调度等。 智能硬件厂商通过实现软硬一体智能助理可获取更大价值。耳机、手机、音箱等智能硬件将是近期智能助理的核心终端载体。原本在智能硬件领域有所积累的厂商,积极将大模型技术结合居家和移动场景,一方面有提升销量的机会,一方面有通过软件服务获取更大价值的机会。 1)随着AI发展,智能音箱、智能耳机成为软硬件一体的多功能设备,结合智能家居、智能座舱和移动携带场景,有望成为各场景里的智能助理核心载体设备,从非必需品转为必需品。 2)除了需求量的提升,软硬一体的智能助理也将有更高的附加值。作为智能助理载体的耳机、音箱相比单一音频设备,终端的价值量将有望提高。同时随着智能助理渗透到用户生活中,可以在产品中加入订阅服务或者广告投放,未来可能产生类似目前手机安卓和iOS生态的耳机、音箱智能助理生态,智能硬件厂商可以类似手机厂商一样向应用软件厂商收取渠道费用。 投资建议 建议关注: 智能助理(耳机/手机/音箱):漫步者、科大讯飞、传音控股、中科创达。 风险提示 AI技术迭代不及预期风险:若AI技术迭代不及预期,则对产业链相关公司会造成一定不利影响。 经济下行超预期风险:若宏观经济景气度下行,固定资产投资额放缓,影响企业再投资意愿,从而影响消费者消费意愿和产业链生产意愿,对整个行业将会造成不利影响。 行业竞争加剧风险:若相关企业加快技术迭代和应用布局,整体行业竞争程度加剧,将会对目前行业内企业的增长产生威胁。