报告编委 报告指导人张扬 爱分析 联合创始人&首席分析师 报告执笔人孟晨静 爱分析 分析师 外部专家(按姓氏拼音排序)高献光 360亿方云 政企产品技术总监 周强 拓尔思 北分媒体事业部总经理 特别鸣谢(按拼音排序) 目录 1.报告综述1 2.搜索型数据库5 3.文档中台3 4.信创ERP12 5.结语17 关于爱分析28 研究咨询服务29 法律声明30 报告综述 5|2023昶ⴔ區⥌㹊騨䫣デ 1.报告综述 在国际局势日趋复杂的大背景下,中央及地方政府出台大量信创相关政策,对信创目标规划、财政补贴、人才支持、生态发展等多方面均做出了明确规定。加快信创产业发展,打造全面自主可控的国产IT架构,已成为我国实现高水平科技自立自强、保障国家安全、推动经济社会数字化转型的重要抓手。 同时,供需两端合力驱动信创在“2+8+N”行业加速落地。多年以来,国内IT行业及数字经济发展所需的基础设施一直被国际巨头所垄断,存在诸多的潜在安全风险,实现核心技术自主可控已经迫在眉睫。而国内厂商的技术能力持续突破,信创产品正在从“要用”向“能用”的跨越,支撑起各行业的常态化采购。 基于上述背景,当前我国信创产业部分领域已经由“试点验证”迈向“规模推广”阶段,各行业实践明确了从基础硬件、到基础软件、再到应用软件的纵向替换路径,以及从数字办公系统、到非核心业务系统、再到核心业务系统的横向路径。从信创替换趋势来看: 基础硬件和软件的替换需求空间最大,以数据库为代表的核心基础软件仍是信创替换的重点; 数字办公系统是央国企信创全面替换首当其冲的软件,接近替换的尾声阶段,其中文档中台作为日常办公和文档管理的基础设施,成为央国企改造的必选项; 大部分行业处于由数字办公系统逐步向智能营销等非核心业务系统替换过渡阶段;能源行业信创落地步伐较快,信创应用逐步从非核心业务系统向ERP等核心业务系统发展。 图1:企业信创替换路径及替换重点方向 构筑数据管理核心安全屏障,数据库国产化替代正当时。大多数企业已经基于Oracle、DB2等国外数据库,构建了完善的数据应用体系。一方面,数据库作为数据存储和处理的核心软件, 支撑上层软件应用和业务管理决策,而传统国外数据库产品难以满足高涉密行业对于数据存储安全的需求。另一方面,传统数据库缺乏弹性扩容、实时数据分析能力,已经无法应对当下数据高并发场景的压力。数据库的国产化替代,成为企业提升自主可控能力、保障数据安全的重要抓手。 文档中台打造办公新体验,赋能企业高效协同办公与信息安全。文档中台对企业办公效率及安 全性提升的价值显著,是央国企必须国产化的场景之一。传统文档管理面临缺乏统一管理工具、文档协同困难、文档安全风险高等问题,影响文档管理的质量和价值挖掘。文档中台能够提供办公文档查看、编辑、协作、管控等能力,助力企业大幅提升办公协同效率的同时,实现文档数据的统一存储、全方位数据资产的安全防控。 高端ERP国产化替代全面开启,新一代数字核心系统助力企业经营提质增效。ERP系统作为贯穿企业各部门的核心管理系统,承载了大量核心业务数据,但国内高端ERP市场长期被SAP、 Oracle等海外厂商所垄断,不仅存在数据安全性、服务稳定性的风险,而且面临传统技术架构无法灵活快速满足业务需求的问题。伴随行业信创的深入、国产厂商产品的成熟,进行ERP软件的国产化升级,将成为企业保障数据安全、实现经营提质增效的必然举措。 综上所述,本报告选择搜索型数据库、文档中台、ERP等3个重点市场进行应用实践分析,以期为企业决策层及业务部门、IT部门负责人提供信创落地实践经验,助力其更好地推进数字化转型升级。 搜索型数据库 4|2023昶ⴔ區霆ⵚ侨㶶⻊㹊騨䫣デ 2.搜索型数据库 2.1经纪业务增长乏力,财富管理成券商增长新动能 搜索型数据库能对数据全文进行搜索,实现对非结构化数据的高效处理分析,是企业复用知识经验、提高经营效率的有效方式。由于国内搜索型数据库起步较晚,国内企业多采用开源软件Elasticsearch完成全文搜索。但使用Elasticsearch也为企业带来挑战和风险,如Elasticsearch开源无法保障数据安全,且对本地化中文支持能力弱、维护成本高等。信创背景下,国内搜索型数据库厂商正在崛起,使企业替换Elasticsearch成为可能。企业对国产搜索型数据库的需求具体如下: 图2:企业对搜索型数据库的核心需求与解决方案示意图 适应企业一到多个内容检索场景。企业不同场景下对搜索型数据库的功能需求不同,如员工查询公司规定流程或是对专业知识进行检索的场景,需要搜索型数据库具备全文检索功能;电商平台对销售额、用户行为、热门商品进行分析场景下,需要搜索型数据库具备聚合分析来计算总销售额、各类商品销售额、用户平均销售额等,协助电商平台优化商品推荐策略;社交媒体中或跨国媒体生成场景下,需要搜索型数据库支持多语种的全文检索和内容推荐等。 满足企业海量数据场景下的实时、高并发访问需求。与结构化数据不同,企业非结构化数据类型丰富且增长迅速,搜索型数据库需要适应企业持续丰富的数据类型和持续增长的数据体量。一方面, 搜索型数据库需要满足用户对快速响应的需求,提高用户体验,如股票交易、外汇交易等场景下,需要搜索型数据库的高时效性支持实时交易决策以及监控市场波动;如用户在社交媒体中对新闻的实时检索、电商平台中消费者对商品价格、促销信息和库存的实时检索等,都需要搜索型数据库具 备高时效性。另一方面,企业面向C端的内容搜索场景需要满足上千、上万甚至更多人同时在线使用,需要搜索型数据库具备高并发性。 满足企业信创需求。由于非结构化数据涉及到企业经营方方面面,信创背景下,政府、国央企和金 融等行业需要将既有的开源搜索型数据库更新为国产自主研发的搜索型数据库,保障数据库安全可控。同时,国产应支持对既有数据库的平滑迁移,使企业可低成本低影响的完成替换过程。 基于以上需求,国产搜索型数据库应在分词、数据索引、排序等核心技术以及分布式数据架构等方面具备较强的能力优势。具体如下: 厂商应具备分词、数据索引、排序等技术,提高数据检索效率。用户业务场景不同,对分词算法要 求不同,如中文环境下,分词算法应支持对中文文本切分,而在多语种搜索场景下,分词算法还应支持中日韩、英法德等多语种切分。针对数据索引,厂商应提供不同场景的索引类型,如针对文本全文搜索提供全文索引,支持用户进行关键词搜索、短语搜索等,针对地理位置查询提供地理空间索引。针对排序,厂商应具备单一字段排序、多字段组合排序、相关性排序、地理位置排序等多种排序算法,适应用户诸如价格排序、销售额和价格排序、文档搜索、地理搜索等不同场景。 支持分布式数据管理。厂商应具备分布式存储技术,支持海量数据存储并随着企业业务增长而弹性 扩展,通过多副本机制实现数据服务高可用,支持高并发,在大量用户请求下仍能保持毫秒级查询速度。同时,厂商也应支持自动故障恢复、多租户与冷热数据分层存储等功能。此外,在数据安全保护方面,厂商应提供权限管理、加密存储等机制保障数据访问和数据存储的机密性。 自主研发,且支持国产化适配。厂商从底层分词算法到核心引擎以及上层系统都完全自研,并且支持与龙芯、海光、飞腾、鲲鹏等国产芯片以及及中标麒麟、统信UOS等国产操作系统的适配。同 时,厂商应兼容常用的Elasticsearch读写接口,或是支持从Elasticsearch到国产搜索型数据库的平滑迁移,减少用户系统改造。 某国家局建设行业管理融媒体平台,打造协同高效的全媒体传播体系 当前,媒体融合已经进入深水区,中央媒体、地方媒体和行业媒体纷纷结合大数据、AI智能、云计算等互联网新技术,从内容、渠道、平台、经营、管理等多方面实践探索媒体融合发展路线。 某国家局是国务院直属事业单位,负责全国对口行业的规划、指导、监督和管理。该国家局媒体发 布渠道包括该局网站、省级和市级300多个网站群、xx头条APP、中国xx报、xx杂志、微博和 微信等第三方媒体号等。 传统媒体工作方式低效,难以支撑融媒体时代发声需求 在传播内容和传播渠道日益丰富的形势下,该国家局亟需实现传统媒体与新兴媒体融合发展,打造协同高效的全媒体传播渠道,规范网络和新媒体平台传播内容和传播秩序。该国家局以传统的纸媒为主、依赖人工的媒体工作方式面临严峻挑战,具体而言: 缺少平台性工具,媒体工作流程长且工具分散。该国家局的媒体业务工作流程包含采编、编辑、校 对、排版、审核等多个阶段,历经多个工具流转,协作效率低下。如采编阶段,采编人员通过邮箱、微信等方式收集的稿件;编辑阶段,编辑人员使用A软件修订功能对稿件进行修改;校对时,编辑人员又转为B软件以及人工对稿的方式进行校对;排版时,美编人员使用C软件进行排版,并将排版后的大样文件通过打印或是以PDF文件的形式给到领导审核。该国家局的采集、编辑、校对、审核等环节相对独立,未构成一个有机的、数字化的整体工作流程。 媒体工作以人工为主,效率低。该国家局的媒体工作仍以人工为主,包括素材收集、编辑、校对以及发布前的查重均需要人工进行。此外,在对各编辑人员进行考核时也全部是人工统计工作量进行 考核。 资源无法共享。该国家局的新闻客户端、纸媒以及第三方平台的数据各自形成孤岛,保存在各编辑 的本地电脑中,在查找资料时需凭人工记忆查找,难以共享、耗时耗力。 协作困难。如在制定发稿计划时,该国家局通过在微信群中公布近期报纸、期刊各个版面发稿计划,信息碎片化,且采编人员不方便查看以及修改,影响团队协作效率。 建设行业管理融媒体平台,打造协同高效的全媒体传播体系 该国家局在融媒体发展战略的指引下,希望通过建设行业管理融媒体生产平台,实现“指挥统一、平台统一、技术统一、数据统一、资源统一”。由于该国家局是国务院直属事业单位,在招投标过程中尤其关注厂商的自主知识产权,最终通过厂商实施经验、自主知识产权、项目质量控制以及可持续合作等多方面评估,选择与拓尔思合作。 拓尔思信息技术股份有限公司(简称“拓尔思”)成立于1993年,是中文全文检索技术的始创者,领先的人工智能、大数据和数据安全产品及服务提供商。拓尔思坚持“数智+赛道”的发展战略,以规模化的数据和知识资产、数字化基座能力和自研大模型能力为媒体、政府、企业赋能,实现数字化转型升级。 在拓尔思协助下,该国家局的行业管理融媒体生产平台项目,历经需求调研、方案设计、国产化适 配开发(操作系统、数据库、中间件等)、业务系统的定制开发、部署、测试优化等工作,于2023 年7月正式上线试运行。具体解决方案如下。 以海贝搜索数据库为核心,建立非结构化数据资源的统一存储和管理 该国家局的融媒体生产平台在数据访问层对接稿件资源、互联网资源、第三方系统资源、素材资源、 成品资源、多媒体资源等内外部多元非结构化数据资源,通过大数据采集工具、ETL工具进行采集、汇聚、清洗和标引后,由海贝搜索数据库进行统一存储和管理。为支撑上层媒体传播分析、绩效考核、资源中心、指挥系统等业务应用,在海贝搜索数据库高效索引的基础上,融合文本聚类、文本分类、关键词抽取、摘要抽取等技术,为用户业务提供数据支撑。 建立一体化平台,支撑媒体生产全流程紧密协作 该国家局的融媒体生产平台覆盖策划、采集、编辑、审核、签发、存档、传播效果分析及反馈等环节,使媒体生产过程中的诸多角色均能在一个平台上完成任务,协作更高效。具体如下: 融媒体平台指挥系统支持管理决策者对发版计划、选题进行统一协调指挥调度,实时查看和修改发版计划,使得该国家局各单位全渠道既能提升宣传合力,也能兼顾各渠道宣传重心,实现 差异化发展。 超融合生产业务综合管理系统支持各单位采编人员进行选题策划、信息采集、稿件编辑、稿件审阅以及稿件发布,集成化的采编平台使采编流程更清晰、协作更高效,并且丰富的在线功能 如支持稿件版本和修改痕迹实时记录、自动查重、智能校对、大样文件在线审阅等,有效缩短 采编发工作周期。 融媒体移动采编系统