您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国信证券]:计算机2023年12月暨2024年度策略:大模型能力日新月异,AI将重塑各行各业 - 发现报告
当前位置:首页/行业研究/报告详情/

计算机2023年12月暨2024年度策略:大模型能力日新月异,AI将重塑各行各业

信息技术2023-12-22熊莉、库宏垚国信证券健***
AI智能总结
查看更多
计算机2023年12月暨2024年度策略:大模型能力日新月异,AI将重塑各行各业

证券研究报告|2023年12月22日 计算机2023年12月暨2024年度策略: 大模型能力日新月异,AI将重塑各行各业 行业研究·深度报告 投资评级:超配(维持评级) 证券分析师:熊莉xiongli1@guosen.com.cn证券投资咨询执业资格证书编码:S0980519030002证券分析师:库宏垚kuhongyao@guosen.com.cn证券投资咨询执业资格证书编码:S0980520010001联系人:艾宪aixian@guosen.com.cn 报告摘要 AI大模型迭代迅速。大模型在参数量、训练数据量以及训练轮数方面均有提升,新一代多模态大模型如GPT-4V和Gemini拓展了大语言模型的能力边界,展示出多样化任务的处理能力。随着基座模型的发展进入新阶段,模型功能迭代和应用生态构建同步进行,GPTs等Agent平台初步尝试全民定制个人AI应用,加速了使大语言模型成为“操作系统”的迭代。 全球AI算力市场快速增长,国产AI算力芯片迎来历史机遇期。模型参数量+训练数据量大幅提升,以及AI应用有望进入爆发式增长阶段,拉动算力需求喷发。根据Gartner数据,2022年全球AI芯片市场规模为442.2亿美金,预计2027年达到1194亿美金,对应22-27年CAGR为22.0%,市场规模快速增长。23年10月,美国收缩对华AI芯片出口,目前市场上主流AI芯片均在限制范围之内,国产AI算力芯片顺势国产替代。根据IDC数据,2023年上半年,中国本土AI芯片出货超5万片,仅占整个市场10%左右份额,国产替代空间广阔。 AI边缘端有望率先落地,AIPC和AI手机值得期待。混合AI架构能够在全球范围带来成本、能耗、性能、隐私、安全和个性化优势,是最优的解决方案;大模 型小型化以及边缘侧AI算力芯片的发展,为混合AI方案的实现奠定了基础,AIPC和AI手机将率先落地。 AI重塑各行业应用,商业化落地已逐步兑现。自动驾驶领域,以特斯拉FSDV12为代表,端到端模型再次推动奇点临近。机器人领域,特斯拉和谷歌均已将大模型推向应用,工业领域应用加快。网络安全领域,国内外均将大模型引入安全运维,改变传统人工服务模式。金融领域,同花顺大模型探索已久,正打造金融大模型—问财HithinkGPT。教育领域,DuolingoMax备受好评,佳发教育产品致力于将AI融入育人场景全过程、全要素场景。医疗领域,谷歌Med-PaLM2成为行业标杆,润达医疗与华为云等合作开展了积极探索。办公领域,微软多应用实现Copilot落地,金山办公WPSAI已全线接入,定价模式可期。 投资建议:关注AI产业持续催化机会,重点关注在AI各领域积极寻求突破的公司,维持“超配”评级。AI大模型日新月异背景下,对人类工作和生活的改变将逐步显现,我们仍认为以AI为核心寻找投资机会是市场主线。在大模型侧,重点关注科大讯飞,三六零;国产算力关注海光信息等;边缘端重点关注AIPC、AI手机产业链;应用端重点关注中科创达、宝信软件、深信服、同花顺、金山办公等。 风险提示:宏观经济下行风险;行业竞争加剧风险;AI大模型和算力等产业发展不及预期;AI相关政策推进不及预期。 目录 01 AI大模型:多模态方向延伸,视频模型迎来发展元年 02 AI算力:国产算力迎历史机遇期 03 AI边缘侧布局正当时,AIPC和手机值得期待 04 AI重塑应用百态,商业落地逐步兑现 05 投资建议:看好AI产业持续催化,维持“超配”评级 AI大模型:人工智能发展的新一里程碑 •AI大模型为人工智能发展的新一里程碑。以1956年达莱茅斯会议为起点,人工智能的发展历史可以归纳为四个阶段,随着互联网、云技术的兴起,人工智能逐步从符号主义向联结主义演进,整体呈现出波浪式前进态势。本轮人工智能由AI大模型推动,将迎来通用人工智能时代。 •阶段一(1956-1986年):基于推理逻辑和规则匹配技术的符号主义为主; •阶段二(1987-2010年):联结主义复兴、神经网络崛起以及深度学习算法突破; •阶段三(2011-2017年):联结主义为主,人工智能迎来深度学习的爆发期; •阶段四(2018年-至今):大模型掀起第四次科技革命,迎来通用人工智能时代。 AI大模型为人工智能发展的新一里程碑 基于推理逻辑和规则匹配技术的符号主义为主 联结主义复兴、神经网络崛起以及深度学习算法突破 联结主义为主,人工智能迎来深度学习的爆发期 大模型掀起第四次科技革命,迎来通用人工智能时代 1956年1987年2011年2018年 1956年:达莱茅斯学院会议,人工智能元年; 1956-1974年:人工智能第一次浪潮,尝试将人类思维方式和语言能力转化为计算机程序,提出很多理论和方法; 1974-1980年:人工智能第一次低谷期,投入下降; 1980-1986年:人工智能第二次浪潮,专家系统发展迎来高潮,利用专家知识提高AI系统的准确性和效率。 1987-1993年:人工智能第二次低谷期,专家系统进入寒冬,神经网络技术重新获得重视; 1994-2010年:人工智能第三次浪潮,机器学习、自然语言处理、计算机视觉、推理及知识表示、强化学习等在这一时期出现了很多新的算法和应用。 深度学习算法突破:2006年杰弗里·辛顿提出深度学习概念,开启了深度学习的热潮。 2011-2017年:人工智能第四次浪潮,也是人工智能深度学习的爆发期,随着计算机技术的发展,人工智能技术得到了快速的普及和提升; 深度学习领域:神经网络等技术的发展使得机器能够从海量的数据中自动提取特征和规律,并进行智能决策和推理; AI领域拓展:自然语言处理、图像识别、语音识别、自动驾驶等; 2018年-至今:人工智能第五次浪潮,以人工智能大模型的提出和ChatGPT技术的突破为标志; 大模型技术:具备了更高的水平的自然语言处理和生成能力,能够从大量的数据中提取知识,并将其应用于各种实际场所,为通用人工智能技术带来希望和路径; 资料来源:田杰华,易欢欢著-《通用人工智能》-中译出版社(2023)-P65、国信证券经济研究所整理 AI大模型:发展趋势-参数量、数据量、训练轮数提升 •AI大模型能力的提升主要有三条路径:模型参数量的提升、训练数据量的提升以及训练轮数的提升。 •模型参数量的提升:以OpenAI的GPT模型为例,第一代GPT模型GPT-1的参数量仅有1.17亿,GPT-2参数量提升至15亿,GPT-3参数量进一 步提升至1750亿,GPT-4的参数量应该达到万亿级别;模型代际之间参数量呈现指数级增长,大模型能力亦随模型参数量的增长而大幅提升; •训练数据量的提升:1)语言模态训练数据量提升;2)多模态训练数据的加入:例如图片、视频等也作为训练数据,训练数据集大小大幅提升; •训练轮数的提升:1)新模型:通过多轮训练,模型能力得到提升,但过多的训练亦会导致模型过拟合;2)已有模型:定期训练(每周、每 月),对模型的能力和数据的时效性进行提升和更新。 模型能力提升的路径 增大模型方法 优势 劣势 难度 可行性 18-23年,模型参数量持续增长 增加模型参数增加模型根本方法 (1)模型结构需要基于先验设计; (2)结构与参数需要复杂设计过程;高高 (3)参数提升、工程训练难度随之提升 增加训练数据 能与模型解耦 (1)增加数据是昂贵的行为; (2)数据来源无法保证多样性和均一性 中 中 增加训练轮数充分利用模型容量过多训练导致模型过拟合;低低 资料来源:智源研究院、国信证券经济研究所整理资料来源:中国人工智能协会、国信证券经济研究所整理 AI大模型:多模态是大模型的未来 •多模态模型是指将不同类型的数据(例如图像、文字、视频、语音等)结合起来进行分析处理的模型。其通过不同数据类型的相互关联和结合,可以大幅提高模型的准确性和鲁棒性,应用场景进一步拓展。其次,多模态更接近人类学习的模式,在物理世界中,人类认知一个事物并不是通过单一模态,例如认知一只宠物,可以从视觉(宠物形貌)、听觉(宠物叫声)、嗅觉(宠物体味)、触觉(宠物毛发、宠物体温等)等多模态全面立体认知,是未来人工智能的发展方向。 •多模态大模型分类:单塔结构和双塔结构。1)单塔结构:只利用一个深度神经网络来完成图像和文本之间的交互融合,本质上属于信息前融合方案;2)双塔结构:利用不同的神经网络来完成不同模态的信息抽取,然后仅在最后一层做信息交互和融合,属于信息后融合方案,具有模型独立性强,训练效率高等优势。 •头部厂商发力多模态大模型,看好多模态多模型未来。2023年下半年,多模态大模型发布频率加快,OpenAI率先发布GPT-4V,随后12月份谷歌发布原生多模态大模型Gemini,多模态大模型已经成为各大模型头部厂商发力的重点。 多模态大模型双塔结构 资料来源:华为、国信证券经济研究所整理 AI大模型逐步从单模态向多模态发展 资料来源:毕马威、国信证券经济研究所整理 AI大模型:商业化落地加速,市场规模快速增长 •大模型商业化落地加速,市场规模快速增长。目前,大模型落地模型主要可分为三种,即大模型、大模型+算力、大模型+应用,其中大模型指企业用户可以直接买断大模型产品,也可以租用大模型(例如中软国际的模型工厂);大模型+算力指厂商将模型与算力进行组合销售;大模型+应用指厂商向企业用户销售融入了大模型能力的上层应用,要求用户支付软件授权费等。短期大模型+算力为主流的收费模式,后随着模型应用、生态的进一步完善,大模型+应用模式占比有望逐步提升。 •全球市场:根据钛媒体国际智库数据,2022年全球大模型市场规模108亿美金,预计2028年达到1095亿美金,对应22-28年CAGR为47%,全球大模型市场规模快速增长。 •中国市场:根据钛媒体国际智库数据,2022年中国大模型市场规模70亿人民币,预计2028年达到1179亿人民币,对应22-28年CAGR为60%,中国大模型市场规模快速增长,且快速全球市场。 全球大模型市场规模快速增长中国大模型市场规模快速增长 1200 1000 800 600 400 200 0 202020212022 全球大模型市场规模(亿美元) 1095 887 624 366 210 280 108 25 58 2023E2024E2025E2026E2027E2028E 1400 1200 1000 800 600 400 200 0 202020212022 中国大模型市场规模(亿人民币) 1179 880 566 318 147 216 15 37 70 2023E2024E2025E2026E2027E2028E 资料来源:钛媒体国际智库、国信证券经济研究所整理资料来源:钛媒体国际智库、国信证券经济研究所整理 GPT-4V:大语言模型边界拓展 GPT4V拓展了语言模型的边界,可处理多样化任务。OpenAI的GPT-4V 图3:GPT-4V可以识别图片并处理 模型代表了语言模型的一个重要扩展,它不仅融合了传统的文本处理能力 ,还加入了图像输入的处理功能,进而提供了更丰富的交互界面和新功能 。这一进步使得GPT-4V能够处理更多样化的任务,增强了用户体验。 GPT-4V的技术基础仍然是GPT-4,保持了相同的训练过程,使用了大量互联网上的文本和图像数据,并结合了人类反馈强化学习(RLHF)来优化其输出。 在安全性方面,OpenAI为GPT-4V实施了严格的评估和缓解措施,包括专家红队测试和高拒绝回答率的安全限制,以防止敏感内容的生成。GPT-4V的OCR功能也得到了改进,以更准确地从像素中读取文本。 GPT-4V在处理多模态攻击和科学文献时仍存在挑战,特别是在医疗领域 ,不建议接受模型提供的任何医疗建议,因为它可能会产生幻觉,部分原因是OCR的不准确性。总的来说,GPT-4V在扩展AI的应用范围和提高用户体验方面迈