您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中泰证券]:计算机行业产业复盘与未来推演:AI应用:追本溯源之后,我们相信什么? - 发现报告
当前位置:首页/行业研究/报告详情/

计算机行业产业复盘与未来推演:AI应用:追本溯源之后,我们相信什么?

信息技术2024-03-21苏仪、闻学臣中泰证券华***
计算机行业产业复盘与未来推演:AI应用:追本溯源之后,我们相信什么?

AI应用的能力来自基础模型的能力,目前产业处于技术突破后向商业落地转变的关键时期。从人工智能的发展历史来看,技术最终能够落地应用才是行业能够维持繁荣的关键。本轮技术革命由生成式大模型开启,将有望诞生真正的通用人工智能。但当下的应用还是集中在AI的原生能力的场景中开发的,GPT Store等新的商业模式还在探索中。 未来的AI应用将走向AI Agent的终极形态,AIOS可能在基础层面提供支撑。Agent是指拥有一定“智能”,能够与环境产生交互的智能体。在软件中Agent可能表现为基于模型原生生成能力的LLM Agent,在C端的形式可能是个人助理,能够处理用户的日程、邮件等;在B端的形式可能是替代OA、办公软件形态存在的集成流程办公软件。 在硬件中Agent可能表现为搭载有大模型的终端手机、PC、机器人等,能够更好满足用户的定制化需求。AI将为计算机带来软硬件层面的重构,AIOS在未来是支持Agent的重要基础。 从产业演进的角度看,应用发展的过程表现出了一定的共性。从模型角度看,垂类和端侧模型推进了应用落地的节奏;从数据角度看,高质量私域数据依旧是模型和应用的核心壁垒;从用户角度看,B端客户关注应用的替代/提效等功能场景,C端用户则更关注产品力表现;从模态角度看,多模态依旧是必然趋势,通用的超级应用最可能诞生在通用多模态LLM之下;从工程角度看,系统将走向AI原生,基础软件、应用软件乃至操作系统都可能迎来重构,计算机的基础架构可能迎来一次改变;从安全角度看,涌现的大模型表现出了超乎想象的能力,保证其本身和数据安全性将会是极其重要的课题。 AI应用在适合原生能力的场景、以及前瞻性应用中的落地更快。从赛道看,具有“大规模+低门槛”的客服对话场景是最先得到应用的,代码生成+低代码开发场景与视觉AI+工业场景同样能得到较快应用。从科研领域看,AI for Science也拥有巨大的潜力,在基础、交叉学科均有前瞻性的应用。 投资建议:人工智能新一轮十年级的技术和产业革命大幕已经拉开。GPT、Sora、Gem ini 1.5、Claude 3等基础模型能力持续迭代,各场景应用已经进入商业模式落地阶段,只需静待数据验证。对应的投资方向如下: 模型视角:建议关注科大讯飞、商汤、格灵深瞳、云从科技、云天励飞、三六零等; 应用模态视角:文本建议关注金山办公、彩讯股份、福昕软件;代码建议关注金现代;图片视频建议关注万兴科技;3D建模建议关注中望软件、索辰科技、广联达、华大九天、概伦电子、浩辰软件、盈建科等; 中长期垂直龙头视角:金蝶国际、广联达、恒生电子、明源云、中科软、用友网络、同花顺、北森控股等; 行业应用场景视角:金融场景建议关注恒生电子、顶点软件、同花顺、中科软、宇信科技、百融云、京北方、天阳科技、长亮科技、新致软件等;医疗场景建议关注卫宁健康、创业慧康、嘉和美康、医渡科技、鹰瞳科技等;汽车场景建议关注中科创达、德赛西威、经纬恒润、万集科技、岩山科技等;其他建议关注焦点科技、萤石网络、鼎捷软件、赛意信息、拓尔思、佳发教育、神思电子、云鼎科技、鸥玛软件、金桥信息等; 安全视角:建议关注深信服、启明星辰、国投智能、天融信、绿盟科技、迪普科技、安恒信息、安博通、盛邦安全、永信至诚、亚信安全、奇安信等。 风险提示:相关技术落地不及预期的风险,行业竞争加剧风险,政策风险,能耗过大风险,信息更新不及时风险等。 投资主题 报告亮点 人工智能是一个具有复杂性的交叉领域。我们复盘了行业发展的历史,对产业共性进行了分析,通过对产业演变的推演分析了其中的核心要素,并试图为投资者寻找到更具确定性的投资方向。 投资逻辑 人工智能新一轮十年级的技术和产业革命大幕已经拉开。Sora、Gemini 1.5、Claude 3等基础模型能力持续迭代,各场景应用已经进入商业模式落地阶段,只需静待数据验证。建议从模型、应用模态、中长期垂直龙头、行业应用、安全视角关注公司。 产业复盘:AI是技术驱动的行业,正处于商业应用关键期 人工智能是赋予机器执行人类行为和任务能力的学科,旨在让机器模仿类似人类智力的复杂认知能力,技术的进步是推动产业创新的核心力量。 产业历史复盘:人工智能经历了各类思想的涌现、对立与融合 与其他技术发展的规律相似,AI技术的发展也是不断融合已有的技术和思想后,加入新的创造并获得新的突破。 纵观人工智能近百年的发展历史,主流的观点基本都来自于三大思想流派:符号主义(Symbolism)、连接主义(Connectionism)和行为主义(Actionism)。 图表1:人工智能的三大流派 针对感官信息在人类记忆中的存储方式和“智能”的产生方式,各学派的观点也不同: 符号主义认为,智能源于数理逻辑,人类的思维过程可以使用符号系统和规则进行表示; 连接主义认为,感官的刺激并不存储在记忆中,而是在神经网络中建立起“刺激-响应”的连接,通过这种连接产生了智能行为。因此智能是一种基于符号的逻辑和计算活动,靠知识和规则进行决策。 行为主义认为,智能是具身化和情境化的,会在与真实环境的交互作用中表现出来,而不是依赖于预先设定的知识和目标。 历史中符号主义和连接主义曾轮流占据行业主流。从连接主义与符号主义被引用的出版物数量对比可以看出,两者曾经轮番引领行业的发展方向。 图表2:连接与符号主义被引用出版物数量比与学术影响 符号主义的强项在于其能够进行知识表示和逻辑推理,可解释性更强; 而连接主义特别擅长于处理大规模数据和模式识别问题。而行为主义适用于处理强化学习,对于神经网络参数的误差传递问题和机器学习中的数值计算问题也有更好表现。 当下越来越多的研究致力于将符号主义和连接主义结合起来,以期望克服各自的局限性,改善AI在部分下游任务中的表现。如将语言模型与知识图谱(KnowledgeGraphs)结合,或在生成阶段使用RAG(Retrieval-Augmented Generation,检索增强生成)方法查询外部数据源等。 图表3:语言模型和知识图谱结合 应用落地始终是横亘在行业前的难题 复盘历史,我们发现AI落地应用才是行业能够维持繁荣的关键。如今人工智能的主流方法论(神经网络等)诞生的时间很早,但由于硬件性能所限,这类算法设想难以落地应用,随之而来的就是整个行业的资金枯竭,研究也进入沉寂期。而在数年或数十年之后,随着软硬件技术的进步,这些设想可能再次获得创新与发展,表现出新的生命力,再次引领行业的热潮。 AI第一次繁荣与寒冬:自1958年人工智能编程语言LISP被开发出来之后,人工智能行业就进入了一次发展的繁荣期。然而在1950s-1960s年代,大量资金和支持被投入到机器翻译的研究中,但应用进展却不顺利。1966年美国政府率先大幅削减了对人工智能研究的投入资金,行业进入了第一次寒冬。 AI第二次繁荣与寒冬:1980年代,随着更多的数据能够输入进计算机中,符号主义的专家系统引领了第二次的人工智能产业繁荣。专家系统在财务规划、医疗诊断、地质勘探和微电子电路设计等领域都能够发挥一定作用。然而专家系统能力依旧有限且构建极为复杂,始终无法真正落地应用。1984年,约翰·麦卡锡批评专家系统,认为它们缺少对自身局限性的常识和知识。1987年至1989年,DARPA ISTO主任Schwarz认为人工智能研究“在特定领域取得的成功非常有限”。随后人工智能研究的资金也快速减少,大量人工智能公司在此期间破产,行业进入了第二次寒冬。 图表4:代表符号主义成果的LISPMachine 从历史中可以发现,AI的两次行业寒冬都是因为硬件和软件技术有所限制,受制于特定领域、特定模型和特定任务的限制,通用性不强,技术没能突破应用奇点,行业投资资金枯竭,最终进入了低谷期。因此,应用商业落地的关注是跟踪本行业的重点。 图表5:1948-2023年人工智能产业发展复盘 AI的第三次繁荣:自从2012年AlexNet为代表的深度学习爆发后,AI产业迎来了第三次繁荣时期。随着AlphaGo战胜围棋世界冠军李世石和柯洁,深度学习也迎来了巨大的关注。2022年10月,随着人工智能对话应用ChatGPT的发布,生成式人工智能GenAI(GenerativeAI)迎来了爆发期。支撑ChatGPT的基础模型GPT-3早在2020年就被创造出来,但只有当ChatGPT这个对话产品走入大众视野中,生成式、通用的人工智能才成为了产业关注的焦点。 图表6:ChatGPT聊天界面 本次的技术突破首先来自算法架构的优化,Transformer突破了文本长距离依赖性的难题,以此为架构的生成式NLP神经网络模型才能够大幅扩充规模和训练集。随后OpenAI又投入了大量算力资源扩充模型的训练集和参数规模,使大模型表现出涌现性并大幅提升泛化能力。自此,生成式人工智能也真正开始拥有了通用性,我们正处于从ANI(窄域人工智能)走向AGI(通用人工智能)时代的开端。 图表7:ANI、AGI与ASI 行业规模将超千亿,AIGC应用空间将迎爆发期 人工智能行业处于快速增长期,直接支出规模将超千亿。IDC预测2027年中国AI投资规模有望达到381亿美元,在全球占比约9%。 与生成式AI相关的AIGC(AIGeneratedContent)市场也将迎来高速爆发期。随着基础持续突破、行业生态逐渐完善和商业模式成熟,2030年AIGC市场规模有望超万亿。 图表8:我国AI市场支出预测(百万美元) 图表9:我国AIGC市场规模预测(亿元) AI应用目前尚处于红海时期,商业模式仍在探索中,竞争格局较为分散。 从底层基础设施、基础模型和衍生的服务、应用等领域的竞争处于早期阶段。 图表10:GenAI产业链划分 未来展望:应用将走向AIAgent终极形态,AIOS将成系统基础 AI的定义中始终包含智能体的概念 Agent是一种软件程序,旨在与其环境交互,感知接收到的数据,并根据该数据采取行动以实现特定目标。通俗理解,即能够与环境(软件或硬件)产生交互行动(Actions)的智能应用。 图表11:AIAgent是什么 在人工智能的历史上,“智能”的概念很早就已经扩展到了智能体Agent的范畴。1950年,由艾伦·图灵提出的图灵测试(TuringTest)被设计成一种思维实验,如果人类提问者无法分辨书面回答是来自人类还是计算机,那就证明通过了测试。这类计算机需要具备多种能力: 自然语言处理(NaturalLanguageProcessing),以使用人类的语言进行交流; 知识表示(KnowledgeRepresentation),以存储它所知道的内容; 自动推理(AutomatedReasoning),以回答问题并得出新的结论; 机器学习(MachineLearning),以适应新的环境并检测和推断模式; 1989年,Harnad又进一步提出完全图灵测试(Total Turing Test),在原始图灵测试的基础上增加了视觉、听觉等其他维度的测试,只有感知、认知能力全部达到了人的标准才算是通过图灵测试。在这样的要求下,计算机需要与真实世界中的对象和人进行交互,还需要拥有更多能力:计算机视觉(ComputerVision)和语音识别功能,用以感知世界; 机器人学(Robotics),以操纵对象并与真实世界产生交互。 图表12:通过图灵测试的计算机所需的能力 Agent正在一步步走向现实。随着人工智能技术的发展,通过CV和语音识别进行人机交互已经成为了现实,将人工智能与机器学结合将成为未来应用发展的核心趋势。当下语音、图像、视频等模态信息处理技术都产生了突破,未来也将为智能系统带来更多信息输入,推进其从感知智能到认知智能的升级,并最终将能力赋能给应用。 图表13:多模态帮助大模型实现感知到认知的升级 从LLM到Agent,还需要经历什么? 根据自主能力的不同,基于LLM的Agent的形态将会经历完全辅助、部分自主、完全自主的过程。