AI能力积淀已久,2023年或将重点发力。1)自2017年起,AI在公司内部即被上升到战略地位。彼时,暂离金山十余年的老将姚冬重回老东家,担任金山办公副总裁,并牵头组建了公司的AI算法、工程和产品团队。截至2022年底,公司AI团队已逾百人,划分为基础设施、平台、产品和应用。2)在研发方面,公司对AI持续重视,2019年上市募投项目即包括办公领域人工智能基础研发中心建设,总投资额约3亿元、计划4年完成。在场景场面,近6亿的月活设备数为AI能力提供了丰厚的生长土壤。目前,公司OCR、机器翻译等多项AI能力已处于国内第一梯队,成为自身业务及产业发展的重要支撑。3)3月14日,根据新华网报道,公司CEO章庆元表示,金山办公今年的核心战略目标是持续赋能企业数字化转型,将重点在AI领域发力,尤其是在AIGC(人工智能生成内容)方面实现更多技术应用突破,帮助客户更好地实现数字化转型。 文字、图像、语音三大技术协同发展,重塑智能办公。1)文字方面,智能文档处理空间广阔,公司将NLP等技术加速落地于办公领域,包括:机器翻译,公司目前可实现多语种的文本、文档翻译,并结合CV技术做好版面格式处理;文档校对,在极短时间内找到大部分错别字,并实现分词、文档分类、识别、提取校对、列示错误给予修改意见等功能;辅助写作,支持文本自动生成、辅助成稿、句子智能补写和文本智能校对等多种功能,还可以结合用户的行为数据和反馈,判断写作偏好,公司智能写作科研项目已有2年半的打磨。2)图像方面,公司OCR能力积淀深厚,可对内容实现抽取、筛选、整理及汇集,实现文档结构化理解;版式还原能力可将将复杂的图片型文档解析为可编辑的文档,并实现弯曲矫正、污染光线、带印章&签名、没有表格线等复杂场景;图像增强及智能排版可借助算法实现文字风格的精准还原,以及文件的格式美化和智能排版。3)语音方面,公司通过语音交互技术可实现文字到语音的快速转化和阅读,并可实现语音速记、语音标注等。4)值得一提的是,2021年7月,公司发布KSAI-lite深度学习推理框架,具有免费、开源、跨端的特性;自适应国内外主流软硬件平台,包括国产信创环境;在OCR(光学字符识别)、机器翻译、智能校对等落地场景具有显著优势,未来预计为公司主流产品和业界提供坚实的AI支持。 迈入认知智能新纪元,AIGC吸引海外巨头持续入场。1)从感知走向认知,知识已成为算力、算法、数据之外的AI发展第四级。2023年1月23日,微软公司通过官方博客宣布扩大与OpenAI的合作伙伴关系;3月7日,微软宣布将ChatGPT的技术扩展到其Power Platform平台上。另外,微软将于3月16日举办一场名为“The Future of Workwith AI”的在线活动,首席执行官纳德拉或将展示类似ChatGPT的人工智能如何在Teams、Word和Outlook等Office生产力套件中发挥作用。2)我们认为,凭借扎实的研发实力、海量的用户及场景积淀、深厚的办公Know-How,AI以及AIGC有望成金山办公业绩增长的重要加速器。 维持“买入”评级。根据关键假设,我们预计2022-2024年公司实现营业收入38.86、52.79、70.06亿元;归母净利润11.24、15.98、21.40亿元。考虑公司作为国产云办公领军的成长持续性,维持“买入”评级。 风险提示:云服务推进不及预期、国有单位IT支出不及预期、人员增速超预期、宏观经济风险。 财务指标 财务报表和主要财务比率 资产负债表(百万元) 现金流量表(百万元) 一、AI能力积淀已久,2023年或将重点发力 AI积淀已久,自2017年起即被提升至战略地位。1)2016年,AlphaGo掀起AI浪潮,金山办公紧随其后加速布局;2017年,在公司内部AI被上升到战略地位,AI中台由此成立;2018年,金山办公确立“多屏、云、AI和内容”四大战略;2020年,智能办公已见雏形,现已开发近100项AI办公能力,涵盖全文翻译、文档校对、智能写作、PPT美化、数据分析等,落地超过18项AI应用,斩获5项国际AI技术大奖。2)我们认为,凭借研发实力、用户积淀和办公Know-How,AI已成金山办公业绩增长的重要加速器。 图表1:2018年金山办公四大战略 副总裁姚冬牵头组建,AI团队已逾百人。1)根据Info报道,2017年5月,暂离金山十余年的老将姚冬重回老东家,担任金山办公副总裁。姚冬自1998年加入金山,此前曾负责过金山词霸、金山游侠等产品。此番重回金山,姚冬转型做AI方向的算法和工程产品,负责算法改进、推动工程落地、人才梯队建设工作,牵头组建了金山办公的AI算法、工程和产品团队。2)截至2022年11月,金山办公的AI团队约有百人规模,划分为基础设施、平台、产品和应用、基础算法等小组。成立5年来,AI团队在每一阶段侧重不同的目标,分“三步走”战略。前两年,团队更强调积累AI研发能力,包括算法能力,工程能力,数据采集,数据分析能力等。后两年更注重将技术产品化,关注AI产品能力。 图表2:副总裁姚冬部分履历 研发力度高,约3亿募投资金用于办公AI项目、计划4年完成。1)2019年11月,公司发布招股说明书,募投项目中办公领域人工智能基础研发中心建设占据16%,总投资额约3.19亿元。2)办公领域人工智能基础研发中心建设方向的建设目标是利用办公领域的人工智能基础技术,提升WPSOffice软件对自然语言和图像文字信息等内容的理解及处理能力,实现提升用户处理文件的速度与效率。主要发力:基于海量语料的人机协同辅助写作系统研发项目、AI自然语言处理平台项目、AI计算机视觉识别平台项目。 图表3:公司上市募投项目 图表4:募投AI相关项目建设时间规划 海量用户、多样场景,为AI提供丰厚的生长土壤。1)截至2022年9月,公司主要产品月活设备数达到5.78亿,延续稳定增长。这一方面为公司积累了丰富的使用场景,另一方面也为AI技术的迭代更新提供了数据经验基础。2)同时,依托在办公领域30多年的研发经验,公司从PC走向移动并走向云,亦在住宿及餐饮业、制造业、建筑行业、教育行业、零售行业等积累了对应的行业Knowhow,具备强落地能力。 图表5:2016/12-2022/9公司主要产品月活设备数 多项能力已处于国内第一梯队,致力于重塑智能办公。1)截至2021年7月,公司自主研发的OCR和机器翻译技术达到了国内第一梯队的水平,智能校对月校对字数超70亿; 智能生成的内容占据整体内容资源比例为33.6%,智能美化功能月度活跃用户数量超百万;AI中台还打造了基于分布式训练的AI训练平台,包含了训练数据处理、训练调度、服务监控告警、链路追踪等一站式平台。2)根据副总裁姚冬表示,公司AI三大发展战略:第一,围绕文字智能处理,提升办公效率;第二,基于认知智能的知识服务;第三,助力企业数字化转型。 图表6:截至2021年金山办公AI应用进展 2023年将重点在AI领域发力,聚焦赋能企业数字化转型。1)3月14日,根据新华网报道,科技创新是企业的命脉,更关乎国家战略发展。金山办公CEO章庆元在接受记者采访时表示,“金山办公是科技自立自强的受益者与践行者,自成立至今35年来,坚持自主创新,解决‘卡脖子’问题,打造出我们自己的民族办公软件品牌”。2)同时,“大力发展数字经济”的政策利好将为金山办公的发展带来重要机遇。章庆元介绍,金山办公今年的核心战略目标是持续赋能企业数字化转型,将重点在AI领域发力,尤其是在AIGC(人工智能生成内容)方面实现更多技术应用突破,帮助客户更好地实现数字化转型。 二、文字、图像、语音三大技术协同发展,重塑智能办公 2.1文字:自然语言处理加速落地,文档智能表现出众 智能文档处理空间广阔,NLP加速落地办公领域。自然语言处理技术迭代升级,在商业领域具备丰富的落地场景,并通过与知识图谱、计算机视觉的技术融合,在文档处理等办公场景发挥重要作用。文档智能通过对数据的深度挖掘,在人工信息审核、翻译、智能写作上表现出众。根据KBV Research预测,全球智能文档处理市场规模预计在2027年将达到41亿美元,企业内部文档数据难题得到有效环节,智能化办公发展加速。 图表7:通用自然语言处理服务平台框架 WPS布局前瞻,NLP等现有成果已包括机器翻译、文档校对、辅助写作: 1、机器翻译:多语种翻译能力增强,结合CV技术做好格式处理。AI技术应用后翻译效果显著提升,结合CV的版式分析优势,机器翻译保证格式、对齐、风格保持一致。借助WPS、稻壳网等产品生态,公司之前的金山智能翻译可以实现文本、文档及多个领域的翻译,并可以进行译后编辑。同时,金山办公发布的蒙文版WPS Office 2021,搭载了AI产品加载项技术,其中机器翻译转化率超90%。 图表8:金山办公文档翻译 图表9:金山办公蒙汉双语表格 2、文档校对:结合丰富的语料库,黑马校对V30保证高效。1)在日常办公中,错别字问题屡现,文档校对功能可以在极短时间内找到大部分错别字,并实现分词、文档分类、识别、提取校对、列示错误给予修改意见等功能。2)据36氪,2021年金山办公全资收购黑马飞腾及其黑马校对相关产品,2022年9月金山办公旗下黑马校对V30版本正式上线,V30版本分析上万亿汉字的语料,拥有约8000万条汉语知识的数据库和约800万条错误规则的数据库,应用于政府及企事业的公文校对和新闻出版行业的质量把关,并嵌入企业业务系统。 图表10:金山黑马办公实现文档校对 图表11:金山黑马办公产品优势 3、辅助写作:公文辅助已有探索,持续2年半投入智能写作研发。1)2018年6月,金山办公成为中国智能写作产业联盟理事长单位,该项目入选“2018年人工智能与实体经济深度融合创新项目”,现已推出公文智能(辅助)写作、WPS智能写作功能。1)公文智能(辅助)写作帮助用户按照GB/T 9704-2012规范性要求进行排版,内置19个公文模板和15种法定公文文种,促进协作效率并避免不同软硬件环境下的错版和跑版情况。2)辅助写作产品积累多个提纲库和语料库,数据均源于权威媒体和政府公开网络,支持文本自动生成、辅助成稿、句子智能补写和文本智能校对等多种功能,除此之外,机器自主学习可以结合用户的行为数据和反馈,判断写作偏好。 图表12:WPS公文版发布 图表13:金山智能写作自动生成 图表14:智能写作创新及产业化公共服务平台科研项目 2.2图像:OCR积累已久,复杂场景、美化功能逐步叠加 CV多场景应用广泛,OCR作为底层通用能力商业价值已现。计算机视觉是通过深度学习算法,使得计算机理解数字图像及视频,并从多模态数据中提取目标信息的能力。OCR技术作为CV的底层通用技术,是最具落地应用价值的AI技术之一,在智慧办公、智慧教育、智慧金融、智慧交通、智慧城市、智慧旅游等多个垂直行业中产生巨大商业价值。 目前金山办公已探索文字识别技术在多个复杂场景下的应用,并发展计算机视觉技术,实现文档矫正、智能抠图、字体识别、表格还原、版式还原、PDF编辑等多元功能。 图表15:深度学习OCR识别技术 计算机视觉积淀深厚,现有成果包括OCR、版式还原及图像识别。 1、OCR:抽取-筛选-整理-汇集,支撑多环境部署,实现文档结构化理解。随着OCR技术在移动端的运用频率增强,金山办公OCR技术迭代升级,除了理解中英文、简繁体等多元文字信息,还可以理解文字背后的语义和结构化信息。1)在CSIG图像图形技术挑战赛中,金山在“中英文购物小票信息理解”中,通过算法对OCR文字框和文字抽取、筛选,并理解中英文信息实现整理和汇集,取得单项赛道冠军及总决赛双冠军。2)在部署环境上,金山办公OCR支持服务端的高精度模型部署和支持手机、PC端的小模型部署,且2019年,OCR模型在移动端推理模型体积不足 10M ,准确度仅比服务端下落2%。 图表16:金山办公在“中英文购物小票信息理 图表17:金山办公OCR文