拓尔思(300229.SZ)公司动态报告 被低估的搜索型数据库2022年11月21日 人工智能领军企业,大数据、安全等领域多点布局取得成效。1)人工智能领域:公司是国内最早从事自然语言处理(NLP)研发的企业之一,在NLP、知识图谱、OCR、图像视频结构化领域都具备自主可控的底层技术,处于行业领先地位。2)大数据领域:公司是最早从事中文全文检索技术研发的企业,具有全球领先的智能检索技术,现已将领先优势拓展到数据采集、治理、分析挖掘等大数据核心技术的全生命周期,所有底层技术均自主可控。3)数据安全领域:公司子公司天行网安是国内最早从事网络安全和数据交换的企业,在数据视频交换、单向导入等方面具有雄厚的技术实力。4)业绩稳步提升:2012-2021年公司整体收入复合增速近20%。 百亿信创数据库市场蓄势待发,搜索引擎细分赛道蕴藏巨大机遇。1)数据库市场:2021年国内数据库市场规模超200亿元,2021-2025年复合增速有望达到近30%。信创数据库市场到2027年有望超过250亿元,2022-2027年复合增速有望达到约35%。2)搜索型数据库:自主化势在必行。目前市场上开放源代码的领先的全文搜索引擎主要是Solr和ElasticSearch,而一系列数据泄漏、大国科技博弈等事件说明国产替代已经势在必行。3)拓尔思:国内搜索型数据库龙头,是目前国内少有的从底层分词算法到全文搜索引擎,以及上层系统都完全自研的纯国产搜索型数据库,核心代码自主率高达100%,适配国内主流信创环境,解决安全相关问题,并且已经具有多个标杆案例。 依托核心能力多点开花,大数据、政务等业务乘风而起。1)公司人工智能和大数据核心技术具有跨行业/领域的通用普适性,大型或头部企业级客户超过8000家,其中金融领域包括5大国有银行、3大政策性银行、50%的股份制商业银行、主要交易所及国家金融监管机构和约300家地方金融监管部门等用户;政府领域覆盖80%的中央和国务院机构,60%的省级政府,50%的地市政府用户。中央人民政府门户网站也采用公司软件构建。2)着眼长远布局未来:云和数据服务保持稳健增长,产品服务的SaaS化比例不断提升;积极布局新兴技术,“数字人”已从概念走向落地,并在北京冬奥会正式使用。 投资建议:公司是人工智能领域龙头企业,依托自身能力布局政企大数据及安全领域,在重要细分领域有较高的客户覆盖水平。同时,在信创大趋势下搜索型数据库的国产替代具有重要潜力,公司作为细分领域龙头拥有全自主核心技术且树立多个标杆案例,未来有望长期受益于信创趋势。预计公司2022-2024年净利润分别为3.24/4.20/5.44亿元,对应PE分别为30X、23X、18X,首次覆盖,给予“推荐”评级。 风险提示:行业竞争加剧的风险;新业务开拓进展不及预期;其他业务存在波动的可能。 盈利预测与财务指标 项目/年度 2021A 2022E 2023E 2024E 营业收入(百万元) 1029 1308 1646 2077 增长率(%) -21.4 27.2 25.8 26.2 归属母公司股东净利润(百万元) 246 324 420 544 增长率(%) -23.0 31.9 29.6 29.6 每股收益(元) 0.34 0.45 0.59 0.76 PE 39 30 23 18 PB 3.8 3.4 3.0 2.6 资料来源:Wind,民生证券研究院预测;(注:股价为2022年11月18日收盘价) 推荐首次评级 当前价格:13.53元 分析师吕伟 执业证书:S0100521110003 电话:021-80508288 邮箱:lvwei_yj@mszq.com 分析师郭新宇 执业证书:S0100518120001 电话:010-85127654 邮箱:guoxinyu@mszq.com 目录 1人工智能领军企业,大数据、安全等领域多点布局取得成效3 2百亿信创数据库市场蓄势待发,搜索引擎细分赛道蕴藏巨大机遇5 2.1数据库市场:信创百亿市场蓄势待发,国产厂商大有可为5 2.2搜索型数据库:自主化势在必行,国产厂商勇担重任6 2.3拓尔思:国内搜索型数据库龙头,国产替代下长期机遇可期7 3依托核心能力多点开花,大数据、政务等业务乘风而起10 4盈利预测与投资建议13 4.1盈利预测假设与业务拆分13 4.2估值分析14 4.3投资建议15 5风险提示16 插图目录18 表格目录18 1人工智能领军企业,大数据、安全等领域多点布局取得成效 公司是国内人工智能、大数据、数据安全等领域的领军企业。1)人工智能领域:公司是国内最早从事自然语言处理(NLP)研发的企业之一,在NLP、知识图谱、OCR、图像视频结构化领域都具备自主可控的底层技术,处于行业领先地位。2)大数据领域:公司是最早从事中文全文检索技术研发的企业,具有全球领先的智能检索技术,现已将领先优势拓展到数据采集、治理、分析挖掘等大数据核心技术的全生命周期,所有底层技术均自主可控。3)数据安全领域:公司子公司天行网安是国内最早从事网络安全和数据交换的企业,发明了国内第一台安全隔离网闸,在数据视频交换、单向导入等方面具有雄厚的技术实力。 图1:2021年公司各项细分业务收入占比 18.45%大数据软件产品 及服务 13.86% 50.13% 人工智能软件产品及服务 安全产品 系统集成及其他 17.56% 资料来源:公司2021年年报,民生证券研究院 公司整体业绩稳步提升,2012-2021年收入复合增速近20%。公司整体业绩稳步提升,收入端2012-2021年收入复合增速近20%,归母净利润2012-2021年收入复合增速近15%。2021年因为公司西部区域总部和大数据研发和运营基地项目已建成投入使用,其配套商业地产全部在上年度确认收入,因此无房地产业务收入,导致2021年收入、利润出现一定波动,但整体看成长趋势不改,2021年人工智能软件产品及服务同比增速达到52%。 图2:公司营业收入及同比增速变化图3:公司归母净利润及同比增速变化 14.00 12.00 10.00 8.00 6.00 4.00 2.00 0.00 100% 营业收入(亿元) 增速 80% 60% 40% 20% 0% -20% -40% 4.00 归母净利润(亿元) 增速 3.00 2.00 1.00 0.00 200% 150% 100% 50% 0% -50% -100% 资料来源:wind,民生证券研究院资料来源:wind,民生证券研究院 2百亿信创数据库市场蓄势待发,搜索引擎细分赛道蕴藏巨大机遇 2.1数据库市场:信创百亿市场蓄势待发,国产厂商大有可为 2021年国内数据库市场规模超200亿元,2021-2025年复合增速有望达到近30%。根据赛迪顾问数据,2021年,中国数据库市场保持快速增长,规模达到 223.5亿元,2019-2021年复合增速达到27%;预计2025年市场规模达到约600 亿元,2021-2025年复合增速有望达到28%。 图4:国内数据库市场规模及增速 市场规模(亿元) 增速 70035% 60030% 50025% 40020% 30015% 20010% 1005% 00% 2019202020212022E2023E2024E2025E 资料来源:赛迪顾问,民生证券研究院 对信创数据库市场的测算: 数据库市场空间:2021-2025年数据根据赛迪顾问数据。参照2021-2025年复合增速(28%),保守估计假设2026、2027年增速为20%、20%。 信创目标市场:考虑到2021年国内服务器出货量中,30%左右为互联网行业 (根据IDC、华经产业研究院2021年数据),但信创主要集中在政府、电信、金融、能源等行业,参考政府、电信、金融市场占比(共约25%)同时考虑还有医疗、教育等细分市场也存在国产替代机遇,因此假设整个市场中40%左右为信创市场。由于服务器和数据库往往成一定比例,因此我们也可以假设整个数据库市场中约40%为信创的目标市场。 海外厂商份额:根据前文数据,2021年下半年,在国内关系型数据库市场中,Oracle、微软、SAP、IBM份额总和仍达到近45%。考虑到国外大厂在国内长期占据市场优势、有部分海外厂商份额在“其他”里,我们假设2021年海外厂商总 份额仍达到60%。后续随着国产替代推进,2022-2027年海外厂商份额逐步下滑至50%/45%/40%/35%/30%/25%(上述假设,基于在未来五年内,在党政和重要行业基本实现国产化目标;同时考虑到在部分关键环节中国产替代可能需要一定时间,因此未将国产化率设定为100%)。 2021 2022E 2023E 2024E 2025E 2026E 2027E 数据库市场规模(亿元) 224 279 356 461 601 721 865 yoy 25% 28% 30% 30% 20% 20% 信创目标市场占比 40% 40% 40% 40% 40% 40% 40% 信创目标市场规模(亿元) 89 112 142 185 240 288 346 海外厂商份额 60% 50% 45% 40% 35% 30% 25% 国产厂商份额 40% 50% 55% 60% 65% 70% 75% 国产厂商可得市场规模(亿 元) 36 56 78 111 156 202 259 测算结果:2022-2027年信创数据库市场(国产厂商在信创市场的可得市场规模)到2027年有望超过250亿元,2022-2027年复合增速有望达到约35%。表1:信创数据库市场规模预测 资料来源:赛迪顾问、华经产业研究院、IDC,民生证券研究院预测 2.2搜索型数据库:自主化势在必行,国产厂商勇担重任 国产数据库浪潮已起,大多数组织都通过关系型数据库很好地管理与利用了结构化数据,但是很多业务的重要见解都隐藏在非结构化数据中。非关系型数据库又称为NoSQL数据库,意味着其将不仅仅限于传统的SQL二元模式,而是进行更广泛的拓展。随着互联网的兴起,传统的关系数据库在处理电商、社交等超大规模和高并发的SNS类型动态网站表现出了功能上的欠缺,而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。 随着我国数字化转型的蓬勃发展,非结构化数据的处理需要依赖基于全文检索的搜索引擎技术,而目前市场上开放源代码的领先的全文搜索引擎主要是Solr和ElasticSearch(以下简称ES)。ES自发布以来迅速占领了全文搜索引擎市场,目前国内外很多企业已放弃自主研发,逐渐转投ES阵营。根据ES财报显示,公司在2021年的营业总收入达到8.62亿美金,2017-2021年收入复合增速达到52%。 图5:ElasticSearch营收及变化情况 1,000 900 800 700 600 500 400 300 200 100 0 20172018201920202021 80% 营收(百万美元) 增速 60% 40% 20% 0% 资料来源:wind,民生证券研究院 国外危机频发,搜索型数据库自主势在必行。1)ES数据泄露事件频发给国内各行业用户敲响了数据安全的警钟。根据Group-IB报告显示,2021年网络上暴露的ES实例超过10万个,约占2021年暴露数据库总数的30%。2019年底发生的一起ES数据库泄露,包括27亿个电子邮件地址,其中10亿个密码是以简单的明文存储,涉及国内多家互联网公司。2)开源软件和安全工具受到国外出口法律限制。2021年美国商务部和安全局发布控制措施,禁止美国公司向中国和俄罗斯等国家出口和转售网络安全产品;2022年美国商务部和安全局又发布了一项针对网络安全领域的出口管制规定,未经审批禁止向中国分享安全漏洞。3)开源协议变更也带来商业风险。2021年初,Elastic公司决定将ServerSidePublicLicense和ElasticLicense两款开源软件的Ap