您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国盛证券]:下半年的超级应用二:智能助理 - 发现报告
当前位置:首页/行业研究/报告详情/

下半年的超级应用二:智能助理

信息技术2023-05-03刘高畅国盛证券梦***
AI智能总结
查看更多
下半年的超级应用二:智能助理

智能助理是下一个超级应用。1)ChatGPT Plugin的发布为智能助理的出现提供了条件,让ChatGPT的能力从NLP拓展到可以获取实时信息并代替用户执行操作,用户可以直接通过人类语言指挥ChatGPT帮自己与各种应用交互。2)大模型具备通用性,可以微调出针对不同应用场景的智能助理。在居家场景,音箱中的智能助理可以帮助我们管理智能家居以及提供情感陪伴;在工作场合,耳机中的智能助理可以作为秘书帮助处理会议纪要等工作;在车内场景,座舱中的智能助理可以帮助我们与辅助驾驶或自动驾驶系统沟通,提高行程中的音乐等娱乐交互体验。3)智能助理会有望向“贾维斯”的方向发展。贾维斯是漫威世界中钢铁侠的AI管家,OpenAI的创始成员Andrej Karpathy在推特上表示自己要创立一个“贾维斯”。随着多模态的发展,智能助理有望越来越全能,成为AI时代的超级管家。 场景应用:音箱、耳机、手机是核心载体,AR愿景未来可期。1)音箱:音箱是智能家居从单品智能走向全屋智能的核心,ChatGPT有望助力智能家居产品渗透率提升,智能音响有望成为重要抓手;同时,音箱也是智能座舱的重要部分,智能助理应用到汽车座舱也是未来趋势。目前结合大模型技术的音箱已在快速落地中:脱口秀演员鸟鸟在微博展示了自己的AI嘴替“鸟鸟分鸟”,这是一个搭载于天猫精灵上的模型。小度科技宣布将融合文心一言,打造针对智能设备场景的人工智能模型“小度灵机”。2)耳机:在户外、旅途或者需要私密性的场景,最合适的语音智能载体还是耳机,因为人类物理条件限制,耳机在未来可见维度内都是优质入口。3)手机:作为目前最成熟的通信工具,手机为用户提供通讯、端处理与界面,是当前智能助理应用最广泛的终端。会出现能同时管理各类APP提供直接语音交互,不需要用户学习各种UI的智能助理。未来随着硬件技术发展,VR/AR头盔,眼镜甚至脑机接口,也都可能成为主流的智能助理载体。 生态演绎:大模型厂商/终端/硬件厂商角逐场景。1)大模型厂商:大模型厂商可能会针对智能助理做优化,但预计不会非常深入,因为大模型本身价值就够高,对于大模型厂商来说,最重要的还是提升基础模型的能力,像OpenAI一样做类似于App Store的生态。2)手机终端:暂时会是智能助理最大载体,但可能不是最终载体。 目前手机普及率远超过PC,衣食住行等方面的服务都普遍可以通过APP来交互,因此智能助理在手机上通过调用各类APP,就能很快代替用户使用现有的各种服务。 但随着未来AR/VR等技术的发展,可能有其它设备代替手机在生活中的地位。3)智能硬件厂商:具有实现软硬一体,综合场景的机会。音箱,带APP的耳机等智能硬件拥有成为智能家居、智能助理核心的机会。智能音箱,智能耳机等智能硬件拥有智能家居,智能座舱以及随身携带等具体使用场景,有望从简单的音频设备,变成软硬件一体的智能助理载体,不仅有机会提升产品需求量,也有机会通过软件服务带来订阅和广告等附加价值。 具备产品积累且积极拥抱新技术的厂商将大有可为。1)漫步者:公司多年来专注于音频技术的研究开发与产品应用,积累了丰富的行业经验和知名度,已经成长为中国第一、全球知名的自有品牌音频企业。23年一季报表现超预期,主营收入5.43亿,同比上升13.5%,归母净利润7620.52万,同比上升38.18%。未来漫步者有望依托自己在移动、居家和车内三大场景的丰富产品以及音频技术积累,与大模型厂商合作推出各类智能助理载体产品。2)科大讯飞:在模型层面,公司计划在5月6日发布星火认知大模型,并将发布面向教育、办公、车载等行业的解决方案。在硬件层面,公司在耳机、学习机等方面具备深厚的AI应用经验,有望搭载模型能力成为智能入口。3)传音控股:被誉为手机行业的“非洲之王”,海外市场占有率高,同时具备自研移动端OS和多个月活用户超千万的APP的软件生态,是海量用户的软硬件一体优质入口。4)奋达科技:是众多知名品牌客户的智能音箱主流供应商,与阿里巴巴合作的天猫精灵连续多年在中国智能音箱市场销量中排名第一,自2017年合作至2022年公司对阿里巴巴累计出货规模近一千万台。5)恒玄科技:智能音频SoC芯片供应商,2022年公司新一代BES2700系列可穿戴主控芯片量产上市,同时绑定三星、OPPO、小米、荣耀、华为、漫步者、阿里、百度、谷歌等大客户,AI时代有望持续受益。6)国光电器:公司是中国电子音响协会会长单位,是全球众多顶级品牌和国内主流品牌如百度等人工智能交互音响产品的供应商。 建议关注: 硬件:漫步者、科大讯飞、奋达科技、国光电器、恒玄科技、惠威科技。 手机:传音控股。 大模型:360、科大讯飞、云从科技、昆仑万维。 风险提示:AI技术迭代不及预期风险;经济下行超预期风险;行业竞争加剧风险。 1.智能助理是下一个超级应用 ChatGPTPlugin的发布为智能助理的出现提供了条件。近期OpenAI宣布解除ChatGPT无法联网的限制,为ChatGPT添加对插件的支持,将其与第三方服务集成或允许其访问最新信息的扩展,这使得使ChatGPT能访问其他网站并获取实时信息,并且可以通过调度API访问相关应用。ChatGPT插件的发布,让ChatGPT的能力从NLP,拓展到可以获取实时信息并代替用户执行操作,用户可以直接通过人类语言指挥ChatGPT帮自己与各种应用交互,一定程度上ChatGPT已经可以当作是人类的智能助理。OpenAI官网展示的插件的具体功能已经包括了推荐餐厅、制定网上购物、出游、办公、检索、语言教学等,涵盖衣食住行各个方面。在插件生态下,大模型的地位将类似现在的操作系统,同时也是未来流量、用户、数据等的核心入口,各类应用基于AIOS展开,智能助理的能力也将渗透到方方面面。现在我们要制定一个旅游计划,需要自己搜索攻略,查询交通工具和酒店的信息,并经过一系列手动操作下单,基于大模型的智能助理可以直接通过语音分析我们的需求,检索网络信息,为我们做出建议,然后帮助我们操作下单。 图表1:ChatGPT插件找餐厅并计算热量 大模型具备通用性,可以微调出针对不同应用场景的智能助理。GPT-4目前已经可以在SAT和律师资格等多项人类考试中获得理想成绩,并且具备很高可操纵性,可以指定对话风格。经过微调的大模型可以更针对性地担任各种应用场景的智能助理。比如在居家场景,音箱中的智能助理可以帮助我们管理智能家居以及提供情感陪伴,作为我们的保姆或者家庭教师;在工作场合,耳机中的智能助理可以作为我们的秘书帮助我们处理繁琐的会议纪要等工作;在车内场景,座舱中的智能助理可以帮助我们与辅助驾驶或自动驾驶系统沟通,也能提高行程中的音乐等娱乐交互体验。 多模态的发展将进一步扩展智能助理的能力范围。近日已经有开发人员将GPT-4与目标检测网络结合,实时捕获摄像头中的物体进行分析并执行人类指令,演示中开发人员在摄像头前拿不同物体向GPT-4提问,比如要求在网上找到牙刷的购买连接,询问手里拿着的电影海报中的人物信息等。未来结合视觉、听觉甚至传感器触觉能力的智能助理将能更全面地服务用户。 图表2:向GPT-4提问摄像头中的物体,得到网络搜索回答 智能助理会持续向贾维斯的方向发展。贾维斯是漫威世界中钢铁侠的AI管家,全称是“只是一个非常智能的系统”(JustARatherVeryIntelligentSystem),他能帮助钢铁侠处理各种事务,可以照顾钢铁侠的饮食起居,分析钢铁侠的身体状况,还能协助钢铁侠战斗等等,是一个全能的助手。AI的发展方向,有望是朝着贾维斯这样的通用人工智能的。 Andrej Karpathy是OpenAI的创始成员,曾加入特斯拉担任前AI高级总监,2月回归OpenAI后,在推特上表示自己要创立一个“贾维斯“。大模型技术打破了AI难以用于不同领域的壁垒,加上多模态的快速发展,智能助理的发展方向一定是越来越全能,科幻电影中的贾维斯离我们已并不遥远。 图表3:Andrej Karpathy推特 2.音箱、耳机、手机是智能助理核心载体,未来AR可能出现 音箱是智能家居从单品智能走向全屋智能的核心。chatGPT带来的技术进步有望助力智能家居产品渗透率提升,而其中智能音响是重要抓手。当前,智能音箱已完成初轮用户普及,成为AIoT的重要端口。在大模型能力加持下,智能音箱一方面能提升对话交互体验,一方面能作为智能家居的管家,通过理解用户意图,调动其它设备比如电视,空调和扫地机器人等,助力实现真正的全屋智能。 图表4:智能音箱发展历程 音箱还是智能座舱的重要部分。智能座舱通过AI和沉浸式的音视频带来的人车交互体验,司机不再只是辛劳的驾驶者,乘客不再只能无聊的打发时间。智能座舱的音箱体验是车厂非常重视的亮点。智能助理应用到汽车座舱,通过语言和用户交互也将是未来趋势。 结合大模型技术的音箱已在飞快落地中: 4月4日,脱口秀演员鸟鸟在微博展示了一个自己的AI嘴替“鸟鸟分鸟”。这是一个搭载于天猫精灵上的模型,模仿鸟鸟的自己的语调,音色和风格。新浪科技向阿里方面求证获悉,“天猫精灵和达摩院一直在紧密合作,其中包括推进大语言模型、声学模型、语音AI等综合应用“。阿里方面回应表示,“个性化大模型是公司重要探索方向,天猫精灵智能交互系统(AliGenie)在达摩院大模型的加持下将得到全面提升,给用户带来更好的服务体验。” 图表5:脱口秀演员鸟鸟微博展示AI嘴替“鸟鸟分鸟“ 继百度官宣类ChatGPT项目“文心一言”后,小度科技宣布将融合文心一言,打造针对智能设备场景的人工智能模型“小度灵机”,并且应用到小度全系产品。 图表6:微博“小度小度“展示超级助理能力 因为人类物理条件限制,在许多场景最合适的语音智能载体还是耳机。除非脑机接口或其它新技术突破,目前语言依然是人类交流的最通用方式,也是与智能助理交流的最佳方式。除了直接与音箱对话,在户外、旅途等移动场景,或者需要私密性的场景,最合适的语音智能载体还是耳机。目前有许多智能耳机都具备一定NLP能力,如接受语言指令播放音乐,自动翻译和录音转文字等,随着智能助理的发展,耳机也将是智能助理的重要载体。 作为目前最成熟的通信工具,手机为用户提供通讯、端处理与界面,是当前智能助理应用最广泛的终端。现在我们为了各种需求,需要安装许多APP,然后学习各种APP的UI,才能完成与系统的交互,各家互联网公司的产品经理都需要想方设法降低用户的学习门槛。随着ChatGPT插件的出现,各类APP都能接入大模型,从而直接处理用户的语言指令,而不需要用户学会操作UI。或者会出现同时管理各类APP的智能助理,用户提出语言需求后,智能助理自己能寻找对应解决方案的APP。对于APP厂商而言,未来适配智能助理是必备能力。 图表7:用户用自然语言向智能助理提出需求,智能助理调用众多APP的接口完成需求 未来随着硬件技术发展,VR/AR头盔,眼镜甚至脑机接口,也都可能成为主流的智能助理载体。 3.生态核心:大模型厂商/终端/硬件厂商角逐场景 AIOS超级时代,大模型厂商/手机终端厂商/智能硬件厂商将各自发挥自己的优势,挖掘智能助理的价值。 图表8:智能助理生态 大模型厂商可能会针对智能助理做优化,比如推出微调版本的智能助理模型。但预计不会非常深入,因为大模型本身价值就够高,众多下游应用厂商为了提供优质解决方案,必然要接入大模型,对于大模型厂商来说,最重要的还是提升基础模型的能力。以现在的OpenAI为例子,开放ChatGPT插件后,OpenAI的地位类似于AppStore,众多开发者通过插件实现各类应用,而插件最终还是要通过OpenAI的付费API才能调用大模型的能力。 手机终端暂时是智能助理最大载体,但可能不是最终载体。目前手机普及率远超过PC,衣食住行等方面的服务都普遍可以通过APP来交互,因此智能助理在手机上通过调用各类APP的接口,就能直接完成大部分用户需求。OpenAI官网近期开始招聘安卓和iOS工程师,计划构建移动端研发团队,很可能即将推出OpenAI官方