AI文本审核行业分类 文本审核分类可以根据不同的标准和需求进行分类,通常情况下会按照文本类型进行分类。 按文本类型进行分类 AI文本审核行业特征 AI文本审核行业特征包括:审核需求与日俱增、人工审核存在明显局限性、AI文本审核技术进步三个特征。 审核需求与日俱增 互联网的发展带动不当内容的快速扩散,文本审核力度加强 互联网的快速发展,不仅使得文本信息急速增长,也包含如恶意信息、仇恨言论和虚假信息等不当内容的快速扩散,影响用户体验、社区安全和法规遵从,增加企业和平台对AI文本审核工具的需求。与此同时, 截至2023年6月,中国网民规模达10.79亿人,较2022年12月增长1,109万人,随着未来中国互联网用户数 量以及社交媒体、在线内容的使用量进一步扩大,AI文本审核工具的需求也将与日俱增。 人工审核存在明显局限性 人工审核存在效率低下、成本高昂、主观性强的问题 首先,在大规模内容平台中,人力成本高昂且效率低下是一个显著问题。其次,审核的主观性和偏见问题导致不同审核人员对同一内容可能做出不同的判断。此外,人工审核在大规模数据处理需求方面存在不 足,很难及时覆盖多样性内容和新兴威胁。审核速度较慢,难以实时应对迅速增长的信息量。为解决这些 问题,许多平台正在转向自动化和智能化的解决方案,例如机器学习和自然语言处理技术,以提高效率、减少人为局限性,并更好地适应多样性和新兴威胁。 AI文本审核技术进步 自然语言处理(NLP)和机器学习等技术被广泛应用于文本审核 近年来,NLP技术以及人工智能技术的快速发展,带动AI文本审核技术快速进步,可以有效地筛选大量文 本数据,减轻人工审核的压力,提高审核效率。与此同时,随着自然语言处理算法的改进以满足不断增长的内容需求,提高工作效率,并创造新的商机,带动AI文本审核行业快速发展。 [3] 1:中国互联网络信息中心C… AI文本审核发展历程 中国AI文本审核行业发展历程可以分为萌芽期、启动期、高速发展期三个阶段。1990年-2000年,中国AI文本审核行业处于萌芽期。随着社交媒体平台的兴起,用户生成的内容迅速增加,使内容审核工作变得更加复 杂,中国厂商开始投资于自动化过滤系统和人工审核团队来应对不适当内容和违规行为;2001年-2014年,中国AI文本审核行业处于启动期。自然语言处理(NLP)和机器学习技术的进步推动AI文本审核的发展;2015年 发展至今,中国AI文本审核行业处于高速发展期。AI文本审核不仅限于文字,还包括图像、音频和视频内容的审 核,以适应多样化的媒体形式。 萌芽期 1990~2000 中国厂商开始投资于自动化过滤系统和人工审核团队来应对不适当内容和违规行为,如基本的关键词 过滤和垃圾邮件过滤技术,这些系统主要基于规则和模式匹配,效果有限,容易被规避。 随着社交媒体平台的兴起,用户生成的内容迅速增加,使内容审核工作变得更加复杂。 启动期 2001~2014 自然语言处理(NLP)和机器学习技术的进步推动AI文本审核的发展。关注点逐渐从简单的关键词匹 配扩展到情感分析、主题识别和实体识别等更复杂的任务。 AI文本审核准确性和误报率仍然是挑战。 高速发展期 2015~2023 随着对在线内容的监管压力增加,AI文本审核行业经历快速发展。政府和平台开始采用更严格的法规,要求内容审核更加精确和可靠。这催生更高级的文本审核技术,包括多语言支持、多模态内容分 析等。 AI文本审核不仅限于文字,还包括图像、音频和视频内容的审核,以适应多样化的媒体形式。 [4] 1:https://zhuanlan.z… 2:知乎 [5] AI文本审核产业链分析 产业链上游 生产制造端 AI基础设施以及技术提供商 上游厂商 科大讯飞股份有限公司 华为云计算技术有限公司 腾讯云计算(北京)有限责任公司 查看全部 产业链上游说明 1.过去十年,人工智能产业是以算法为核心,通过深度学习算法的不断创新,推动人工智能产业的快速发展。AI技术的发展要求算法模型根据潜在的应用场景变化而持续更新,因此算法模型所使用的训 练数据亦需要定期更新,约1/3的算法模型每月至少更新一次,约1/4的算法模型每日至少更新一次,算法模型持续更新的特点将进一步拓展各领域训练数据的需求空间。 2.随着算法发展趋于开源,想要更快更好提升人工智能能力,数据将发挥更重要的作用。算法模型从 技术理论到应用实践的落地过程依赖于大量的训练数据。训练数据越多、越完整、质量越高,模型推断的结论越可靠。从目前的行业经验来看,超过10万条训练数据进行模型训练,才能保证模型的有效 性和可靠性。因此未来AI基础设施的研究中,80%的工作应该放在数据准备上,以确保数据质量,推动机器学习快速发展。数据对于人工智能技术的长期发展具有重要价值和核心作用,AI基础数据需求 和多样性将会快速增加。预计到2023年,全球数据标注市场规模将超过72.51亿美元,同比增长33%。 中 产业链中游 品牌端 中游厂商 人民网股份有限公司 产业链下游说明 1.随着互联网的普及,社交媒体、电商平台等在线服务的大量使用,对文本内容的审核需求逐渐增加。例如2022年,在线内容市场规模高达21万亿元,网络文学用户规模达5.28亿人,为AI文本审核 打开市场空间。此外,由于全球各个国家对网络内容安全的重视不断加深,政府、企业和社交平台等不同领域对有害信息、虚假广告等违规内容的审核需求日益迫切,推动AI文本审核技术的应用。 2.生成式人工智能技术发展为网络文学行业提供增长动力,同时带来新的文本审核需求。近年来,网 AI文本审核行业规模 中国AI文本审核行业市场规模由2018年的18亿元增长至2022年的30亿元,随着内容市场的增长以及中国政 府对互联网审核制度的重视,预测至2027年市场规模将增长至168亿元,2023-2027年年复合增长率为41%。 中国AI文本审核行业市场规模快速增长的原因在于:1.近年来,社交媒体和在线内容的使用量快速扩大,为维护用户体验、社区安全和法规遵从,企业和平台对AI文本审核工具的需求日益增加。2022年中国在线内容市 场规模高达21万亿元,同比增长16%,同时相关应用所产生的数据量也急剧增长,如社交媒体方面,微信有每天10亿用户登录,发送45亿条消息。大量的文本数据涌入网络的同时,也包含各种形式的不当内容,如恶意信 息、仇恨言论和虚假信息。传统人工审核存在效率低下的问题,推动AI文本审核需求的增长。2.中国政府对在线平台内容的监管要求均日益提高,特别是在涉及用户隐私、网络安全和仇恨犯罪等方面,促进市场整体需求剧 增,推动AI文本审核行业快速发展。如中国颁布《网络安全法》规定不按照有关部门的要求对法律、行政法规禁 止发布或者传输的信息,采取停止传输、消除等处置措施的,拒不改正或者情节严重的,处五万元以上五十万元以下罚款,对直接负责的主管人员和其他直接责任人员,处一万元以上十万元以下罚款。企业为遵守法规和规 定,需要强化其文本审核机制,以识别和移除违规内容,带动AI文本审核工具的市场需求。 未来,中国AI文本审核行业市场规模将继续保持增长趋势,其原因在于:1.5.5G以及6G网络的建设,将推 动网络能力及网络容量提升至少10倍,促使网络文本信息量增长,拉动AI文本审核市场需求。5.5G时代将会使物联网连接数量从100亿增加到1,000亿,大幅提升网络速度、网络容量和传输延迟等方面,带来文本信息数据 量的剧增,人工审核难以负担,推动AI文本审核行业发展。2.随着AI文本审核技术的算法和模型不断提升,在精确性和效率方面将提升10倍以上,能够满足更广泛的文本审核场景。截至2023年6月,中国已催生出79款基于 NLP的语言大模型,为开发者节省超过50-90%的开发时间。与此同时,大数据和云计算能力的提升显著提高了 模型训练的规模和速度,为文本审核技术提供强大的实时性和精度支持,帮助企业在成本可控的基础上实现从通 用领域向专业垂直领域的业务部署。 AI文本审核行业规模,2018-2027年预测 AI文本审核行业规模 政策名称 颁布主体 生效日期 影响 《“十四五”规划和2035年远景 中共中央 2021-03 目标纲要》 推动中国经济高质量发展,实现全面建设社会主义现代化国家的目标。充分发挥海量数据和丰富应用场景 政策内容 优势,促进数字技术与实体经济深度融合,催生新产业、新业态、新模式。 “十四五”时期经济社会发展主要目标:到2025年,数字经济核心产业增加值占GDP比重增长至10%,全 政策解读 社会研发经费投入强度高于“十三五”时期,加强原创性引领性科技攻关,有利于AI文本审核产业技术创 新升级。 政策性质 指导性政策 政策名称 颁布主体 生效日期 影响 《关于支持建设新一代人工智能示 科技部 2022-08 通过支持建设新一代人工智能示范应用场景,推动人工智能技术在经济高质量发展中的应用,同时坚持四 政策内容 个面向、加强政策支持、人才培养和国际合作等方面的工作。 为加快推动人工智能应用,助力稳经济,培育新的经济增长点,打造形成一批标杆型示范应用场景,包括 政策解读 智能教育、智慧法院、智能诊疗等场景,推动AI文本审核在行业场景中的应用。 政策性质 鼓励性政策 政策名称 颁布主体 生效日期 影响 《关于加快场景创新以人工智能高 科技部、教育部、工业和信息化 水平应用促进经济高质量发展的指 部、交通运输部、农业农村部、国 2022-07 政策性质 规范类政策 政策名称 颁布主体 生效日期 影响 发展改革委、市场监管总局、中央 《关于推动平台经济规范健康持续 网信办、工业和信息化部、人力资 2021-12 发展的若干意见》 源社会保障部、农业农村部、商务 部、人民银行、税务总局 该政策围绕健全完善规则制度、提升监管能力和水平、优化发展环境、增强创新发展能力、赋能经济转型 发展以及保障措施六方面展开,立足新发展阶段、贯彻新发展理念、构建新发展格局,推动高质量发展, 政策内容 遵循市场规律,着眼长远、兼顾当前,补齐短板、强化弱项,适应平台经济发展规律,建立健全规则制 度,优化平台经济发展环境。 为进一步推动平台经济规范健康持续发展,健全制度规范,厘清平台责任边界,强化超大型互联网平台责 政策解读 任,建立平台合规管理制度,对平台合规形成有效的外部监督、评价体系,提高AI文本审核行业的规范 性。 政策性质 指导性政策 中国AI文本审核市场的竞争格局中,具有明显的行业壁垒。行业呈现以下梯队情况:第一梯队公司为百度智 能云、阿里云以及腾讯云;第二梯队公司为网易易盾、华为云、数美科技、火山引擎以及金山云;第三梯队公司 为达观数据、图普科技。 中国AI文本审核行业市场竞争格局分布的主要原因在于:1.头部企业具有技术研发和算法优势,形成明显的 行业壁垒。百度、腾讯和阿里凭借卓越的技术研发和算法优势建立起显著的竞争优势,三家公司在人工智能领域投入巨大,拥有自主研发的高效文本审核算法。如百度在人工智能领域10年间累计投入超过1,000亿元,其中核 心研发投入占核心收入比例连续多个季度超过20%。2022年,百度研发费用为233亿元,占核心收入的24.42%,形成明显的技术壁垒,使得其他企业难以迎头赶上。2.头部企业注重市场拓展和生态系统建设,且具有丰富的数 据资源和训练集积累,使得大规模用户数据的独特优势成为行业内的另一重要竞争壁垒。AI文本审核头部企业,依托庞大的用户基础,积累丰富的文本数据,构建强大的数据资源和训练集,为头部企业的文本审核系统提供充足的训练材料,使得系统更具智能化和适应性。例如微信及WeChat的合并月活跃账户数超12亿,使得腾讯可以 零成本复制数