行业研究|行业周报 看好(维持) 开门红后未来表现仍值得期待,数据要素、AI、信创是核心方向 ——计算机行业周报 计算机行业 国家/地区中国 行业计算机行业 报告发布日期2023年02月05日 核心观点 上周计算机行业取得了兔年“开门红”,涨幅达到4.9%,领先于市场各指数,其中AI板块在ChatGPT主题催化下表现突出。我们依然看好后续板块表现机会,主要出于两方面原因,一方面是国家对数字经济的支持力度不断加大,政策频出将对行 业估值带来正面影响,第二,疫情防控常态化后,下游需求有望出现较好恢复,板块业绩表现值得期待。此外,ChatGPT为代表的新技术突破,也给部分公司带来了主题催化。 ChatGPT是AI技术新的技术突破。目前人工智能已具备生成新事物的能力,而不是仅仅局限于分析已经存在的东西,AIGC可以基于训练数据和生成算法模型,自主 生成创造新的文本、图像、音乐、视频、3D交互内容等各种形式的内容和数据。OpenAI于去年发布的ChatGPT即为典型的文本生成式的AIGC,在日常对话、专业问题回答、信息检索、文学创作、代码生成等方面具备强大的能力。目前,ChatGPT及AIGC概念获得了科技巨头、资本市场的空前关注,建议关注在语音、视觉、NLP等领域有深刻AI算法积累的厂商。 数据要素领域政策有望持续推出。去年底“数据二十条”发布后,各个部委将围绕顶层文件中所明确的原则与方向进行一系列具体细则与措施的制定,我们预计2023 年数据要素领域政策将密集发布,从而帮助行业实现从0到1的突破。大的市场空间、较长的产业链条、广泛而深入的影响,都将使得相关主线的持续性值得期待。我们继续推荐数据资源持有方、公共数据授权运营企业以及相关技术服务提供商。 行业信创有望迎来逐步落地。伴随着各家央国企2023年“两会”的召开以及新的一年工作计划、预算的制定,我们认为,行业与央国企信创有望迎来试点落地与招投 标启动。我们认为,基础软硬件企业将有较大的业绩弹性,而ERP、OA等管理软件企业有望通过试点、订单的落地,让市场对需求体量和份额有更清晰的预期。相对而言,我们更加看好行业信创中的管理和业务软件商,并建议投资者关注出现明显边际变化的品种。 产业数字化与工业软件有着较高的景气度。我们认为,产业数字化转型正成为众多行业降本增效的有力手段,产业互联网平台值得重视。此外,工业生产领域的智能 化升级需求较为旺盛,工业软件企业今年以来在产品迭代升级、业务领域扩展及客户拓展方面都有较好进展,继续维持较好的景气度。 浦俊懿021-63325888*6106 pujunyi@orientsec.com.cn 执业证书编号:S0860514050004 陈超021-63325888*3144 chenchao3@orientsec.com.cn 执业证书编号:S0860521050002 谢忱xiechen@orientsec.com.cn 执业证书编号:S0860522090004 杜云飞duyunfei@orientsec.com.cn 投资建议与投资标的 数据要素领域:建议关注上海钢联(300226,未评级)、航天宏图(688066,买入)、 云赛智联(600602,未评级)、深桑达A(000032,未评级)、每日互动(300766,未评 级)、星环科技-U(688031,未评级)、中远海科(002401,未评级)、三维天地(301159,未评级)、安恒信息(688023,增持)、新点软件(688232,未评级)、易华录(300212,未评级)、东方国信(300166,未评级)、奇安信-U(688561,未评级)。 AI领域:建议关注科大讯飞(002230,买入)、拓尔思(300229,未评级)、云从科技-UW(688327,未评级)、格灵深瞳-U(688207,未评级)。 信创与国产化领域:推荐远光软件(002063,买入)、用友网络(600588,买入)、中科曙光(603019,买入)、海光信息(688041,买入),建议关注普联软件(300996,未评级)、致远互联(688369,未评级)、中国软件(600536,未评级)、神州数码(000034,未评级)。 产业数字化和工业软件领域:看好国联股份(603613,买入)、瑞纳智能(301129,买入)、赛意信息(300687,买入)、和达科技(688296,买入),建议关注广联达(002410,未评级)、容知日新(688768,未评级)。 风险提示 ChatGPT及AIGC落地不及预期,AI企业研发进展不及预期。 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 目录 一、本周行业观点4 二、本周行业专题:ChatGPT与AIGC开启人工智能新纪元5 风险提示9 图表目录 图1:ChatGPT的能力与局限性5 图2:ChatGPT使用案例5 图3:GPT-3模型与其他模型的训练算力消耗6 图4:ChatGPT利用RLHF进行训练6 图5:OpenAI推出付费试点订阅计划ChatGPTPlus7 图6:内容创作模式的四个发展阶段7 图7:2022年Gartner人工智能成熟度曲线8 图8:2022年Gartner影响力雷达8 图9:AI模型进展与应用时间表8 图10:生成式AI应用全景图8 图11:近年来AICG领域的投资情况9 表1:GPT历代产品5 一、本周行业观点 上周计算机行业取得了兔年“开门红”,涨幅达到4.9%,领先于市场各指数,其中AI板块在ChatGPT主题催化下表现突出。我们依然看好后续板块表现机会,主要出于两方面原因,一方面是国家对数字经济的支持力度不断加大,政策频出将对行业估值带来正面影响,第二,疫情防控常态化后,下游需求有望出现较好恢复,板块业绩表现值得期待。此外,ChatGPT为代表的新技术突破,也给部分公司带来了主题催化。 ChatGPT是AI技术新的技术突破。目前人工智能已具备生成新事物的能力,而不是仅仅局限于分析已经存在的东西,AIGC可以基于训练数据和生成算法模型,自主生成创造新的文本、图像、音乐、视频、3D交互内容等各种形式的内容和数据。OpenAI于去年发布的ChatGPT即为典型的 文本生成式的AIGC,在日常对话、专业问题回答、信息检索、文学创作、代码生成等方面具备强大的能力。目前,ChatGPT及AIGC概念获得了科技巨头、资本市场的空前关注,建议关注在语音、视觉、NLP等领域有深刻AI算法积累的厂商。 数据要素领域政策有望持续推出。去年底“数据二十条”发布后,各个部委将围绕顶层文件中所明确的原则与方向进行一系列具体细则与措施的制定,我们预计2023年数据要素领域政策将密集 发布,从而帮助行业实现从0到1的突破。大的市场空间、较长的产业链条、广泛而深入的影响,都将使得相关主线的持续性值得期待。我们继续推荐数据资源持有方、公共数据授权运营企业以及相关技术服务提供商。 行业信创有望迎来逐步落地。伴随着各家央国企2023年“两会”的召开以及新的一年工作计划、预算的制定,我们认为,行业与央国企信创有望迎来试点落地与招投标启动。我们认为,基础软硬件企业将有较大的业绩弹性,而ERP、OA等管理软件企业有望通过试点、订单的落地,让市 场对需求体量和份额有更清晰的预期。相对而言,我们更加看好行业信创中的管理和业务软件商,并建议投资者关注出现明显边际变化的品种。 产业数字化与工业软件有着较高的景气度。我们认为,产业数字化转型正成为众多行业降本增效的有力手段,产业互联网平台值得重视。此外,工业生产领域的智能化升级需求较为旺盛,工业软件企业今年以来在产品迭代升级、业务领域扩展及客户拓展方面都有较好进展,继续维持较好的景气度。 二、本周行业专题:ChatGPT与AIGC开启人工智能新纪元 2022年11月10日,OpenAI发布了最新的对话式AI模型ChatGPT。ChatGPT可以采用对话的形式与人进行交互,具备回答后续问题、承认错误、质疑不正确的前提和拒绝不适当的请求的能力,在日常对话、专业问题回答、信息检索、文学创作、代码生成等方面具备强大的能力。ChatGPT面世之后获得了空前关注,上线仅5天用户就超过了100万。 图1:ChatGPT的能力与局限性图2:ChatGPT使用案例 数据来源:OpenAI,东方证券研究所数据来源:OpenAI,东方证券研究所 GPT已经历了三个版本的发展,ChatGPT是GPT-3与GPT-4之间的过渡版本。GPT (GenerativePre-trainedTransformer,生成式预训练语言模型)系列模型是一种基于互联网可用数据训练的文本生成深度学习模型,这一系列的模型可以在非常复杂的NLP任务中取得非常惊艳的效果,例如文章生成,代码生成,机器翻译,Q&A等,而完成这些任务并不需要有监督学习进行模型微调。GPT的模型的训练需要超大的训练语料,超多的模型参数以及超强的计算资源,而OpenAI正是通过不断提升训练语料的规模和质量,提升网络的参数数量来完成GPT系列的迭代更新的:从GPT-1到GPT-3,每一代模型较前一代的参数量都实现了数量级上的增加,GPT-3模型引入了1750亿的训练参数,开启了超大模型时代,而ChatGPT可视为GPT-3的微调版本,也即GPT-3.5。 表1:GPT历代产品 GPT名称 发布时间 参数量 预训练数据量 升级内容 GPT-1 2018.06 1.17亿 约5GB 无监督学习,从而对高质量标注数据的要求比较低,有比较强的泛化能力。 GPT-2 2019.02 15亿 40GB 开源,使用了更多的网络参数与更大的数据集,验证了通过海量数据和大量参数训练出来的词向量模型可迁移到其它类别任务中,而不需要额外的训练。 GPT-3 2020.05 1750亿 45TB 海量数据,从而在不使用样本、使用极少量样本完成下游 NLP任务,还可以完成数学加法、代码编写等任务。 ChatGPT 2022.11 未公布 未公布 引入RLHF技术,为会话而生,可以进行连续对话。 数据来源:CSDN,公开信息整理,东方证券研究所 图3:GPT-3模型与其他模型的训练算力消耗 数据来源:《LanguageModelsareFew-ShotLearners》,东方证券研究所 ChatGPT基于InstructGPT的模型思路,通过基于人类反馈的强化学习(ReinforcementLearningfromHumanFeedback,RLHF)进行训练: 1>第一步:采集基于prompt(大量的提示文本)训练方式的数据集,利用人工的方式标注人类希望得到的回答,并以该训练集对微调的GPT-3进行监督学习,得到微调后的模型SFT(也即GPT-3.5); 2>第二步:使用微调后的模型进行预测,得到不同的结果,利用人工的方式根据输出的结果的好坏对其进行排序,并把排序后的数据用来训练奖励模型(RM); 3>第三步:使用PPO的强化学习方法更新参数,使用SFT再此对数据集进行预测并通过奖励模型打分,计算出奖励分数,再利用PPO根据奖励值更新策略参数,以此持续迭代优化。 图4:ChatGPT利用RLHF进行训练 数据来源:OpenAI,东方证券研究所 OpenAI推出ChatGPT付费试点订阅计划,ChatGPT应用生态有望快速扩大。2月2日,美国OpenAI公司宣布推出付费试点订阅计划ChatGPTPlus,定价每月20美元。付费版功能包括高峰时段免排队、快速响应以及优先获得新功能和改进等。此外,ChatGPT也获得了众多科技巨头的关注:2月2日,微软宣布旗下所有产品将全线整合ChatGPT,预计3月ChatGPT将内置于Bing搜索;百度将在3月推出基于ChatGPT的生成式搜索;数字媒体公司Buzzfeed