2024计算机辅助翻译技术发展与应⽤蓝⽪书编写单位 中国外⽂局翻译院智能翻译实验室 RWS集团 目录 卷首语6 一、翻译行业数字化、智能化升级是时代之需7 (一)翻译是国际传播的“最后一公里”7 (二)新技术为翻译行业带来发展新动力7 (三)人机协作构建翻译工作新模式8 二、计算机辅助翻译概述9 (一)核心概念9 (二)发展历程10 1.萌芽期(1967-1983)10 2.稳定发展期(1984-1992)11 3.迅猛发展期(1993-2002)11 4.蓬勃发展期(2003年至今)12 (三)系统架构12 1.用户交互层13 2.功能服务层13 3.数据管理层14 4.底层技术支撑层14 5.基础设施层15 (四)产品形式15 1.桌面应用15 2.在线/云端解决方案15 3.插件或集成式工具15 4.定制化企业级系统15 三、计算机辅助翻译发展现状16 (一)助力降本增效,获得行业认可16 (二)功能日趋完善,满足多重需求17 (三)应用场景丰富,适用更多领域18 (四)融合人工智能,持续提升质效19 四、计算机辅助翻译在行业中的应用20 (一)计算机辅助翻译应用概述20 (二)计算机辅助翻译应用案例22 1.助力本地化工作开展,拓展国际市场22 2.提升多语种翻译效能,赋能协同管理23 3.实现翻译流程自动化,促进业务增长24 4.推动各领域翻译提效,驱动行业发展25 五、计算机辅助翻译发展面临的挑战27 (一)我国自研产品与海外产品存在差距27 (二)非通用语种资源建设亟待加强28 (三)用户体验仍有提升空间29 (四)数据安全需引起更多重视29 (五)计算机辅助翻译教学与行业脱节30 六、计算机辅助翻译发展趋势和建议31 (一)趋势展望31 1.人工智能驱动个性化翻译31 2.云技术与协同翻译深度融合31 3.技术堆栈的多元化与集成化31 4.翻译质量评估与自动优化32 (二)发展建议32 1.加强国产自研,打造国产翻译技术服务生态体系32 2.推动标准建设,引导和规范翻译技术发展应用32 3.统筹汇聚语料,为翻译技术发展提供数据支撑33 4.提升技术素养,加快计算机辅助翻译普及应用33 5.深化融合发展,挖掘翻译技术发展更多可能性33 结束语34 参考文献35 卷首语 科技兴则民族兴,科技强则国家强。习近平总书记多次强调“科技是第一生产力”,并对加快建设科 技强国,实现高水平科技自立自强作出具体部署。当前,信息技术飞速进步,对翻译行业起着巨大的推动作用,同时也开辟了新的“赛道”。以计算机辅助翻译为代表的翻译技术深刻改变着传统翻译行业的工作模式和流程,在翻译实践中发挥的重要作用日益凸显。 计算机辅助翻译是利用计算机技术辅助人类进行翻译的一种模式,它利用计算机特有的自动化和智能 化处理能力来提高翻译效率和质量。面对新形势,《2024计算机辅助翻译技术发展与应用蓝皮书》(以下简称“《蓝皮书》”)系统梳理计算机辅助翻译技术的发展历程、系统架构、产品形式和应用情况,以期 为读者提供客观、全面、权威的信息,为推动计算机辅助翻译技术与各行业的深度融合提供有益借鉴,为计算机辅助翻译技术的进步发展提供有力支撑,为促进国际传播、对外交往、文化交流、行业数字化升级等工作注入新的活力。 《蓝皮书》在2024中国翻译协会年会“新时代翻译技术创新发展论坛”上,由中国外文局翻译院、中国翻译协会翻译技术委员会、RWS集团联合发布。希望以此次发布为契机,进一步推动行业和产业各方对计算机辅助翻译技术的研究应用,为计算机辅助翻译技术升级创新提供更加全面、系统、科学的理论支持和技术保障。 《蓝皮书》由中国外文局翻译院智能翻译实验室和RWS集团主编,得到了来自政产学研各界专家学者的指导和关注,兼具权威性和可读性。希望能对计算机辅助翻译技术创新发展和行业应用有所启发,促进翻译行业科学健康发展。 《蓝皮书》编写团队 2024年3月 一、翻译行业数字化、智能化升级是时代之需 在文化软实力和国际话语权竞争空前激烈、新一轮科技革命和产业变革重构全球创新版图的今天,翻译行业要顺应发展潮流、响应时代之需,全面加强数字化发展布局,探索技术赋能翻译行业健康发展新路径。 (一)翻译是国际传播的“最后一公里” 党的十八大以来,以习近平同志为核心的党中央高度重视国际传播工作。在党的二十大报告中,总书 记指出要“加强国际传播能力建设,全面提升国际传播效能,形成同我国综合国力和国际地位相匹配的国际话语权”,从党和国家事业发展全局的战略高度,进一步明确了国际传播工作的时代使命和目标任务。 2023年10月召开的全国宣传思想文化工作会议正式提出习近平文化思想,强调要“着力加强国际传播能力建设、促进文明交流互鉴,充分激发全民族文化创新创造活力”,为新时代国际传播工作提出了新任务、新要求。 在当今开放、多元、复杂的国际环境下,迫切需要以高度的文化自信,创新话语体系,讲好中国故事, 传播好中国声音,让中国故事、中国声音得到国际社会的理解与认同。习近平总书记强调,通过准确传神 的翻译介绍,让世界更好认识新时代的中国,对推进中外文明交流互鉴很有意义。翻译作为跨语言、跨文化沟通的桥梁纽带,在推动构建中国话语和中国叙事体系、增强我国国际传播能力和国家软实力等方面发 挥着重要作用。向世界阐释推介具有中国特色、体现中国精神、蕴藏中国智慧的优秀文化,推动我国在现代化建设中广泛吸收和借鉴人类文明的优秀成果,是新时代翻译工作的首要职责使命。 (二)新技术为翻译行业带来发展新动力 近年来,新一代信息技术对各行各业产生巨大影响,各种新应用、新业态不断涌现。面对新形势,党的二十大对“加快实施创新驱动发展战略”作出部署,强调要“加快实现高水平科技自立自强”,“增强 自主创新能力”。习近平总书记指出,“以信息技术、人工智能为代表的新兴科技快速发展,大大拓展了 时间、空间和人们认知范围,人类正在进入一个‘人机物’三元融合的万物智能时代”。加快发展新一代人工智能是我们赢得全球科技竞争主动权的重要战略抓手,也是推动我国科技跨越发展、产业优化升级、生产力整体跃升的重要战略资源。 2022年以来,生成式人工智能技术迅猛发展,在智能问答、多模态翻译等方面取得重大突破。把握新 科技革命浪潮,加快翻译领域新技术研发和应用推广,对推动我国翻译行业高质量发展、促进国家翻译能力建设和国际传播能力建设具有重要意义。面对翻译行业发展新形势、新任务,行业各方应携手推动计算 机辅助翻译、机器翻译、翻译语料库和术语库等基础设施的智能化革新,打造融合最新技术发展、符合实践需求的智能翻译管理平台,促进新技术在翻译实践中的应用落地,不断提升我国翻译行业技术应用水平。 (三)人机协作构建翻译工作新模式 在新技术迅猛发展的今天,科技赋能国家翻译能力建设已是时代之需。根据中国翻译协会发布的《2024中国翻译行业发展报告》,在参与调研的翻译企业中,2023年有52.9%的项目使用了机器翻译。在许多大 规模翻译项目中,计算机辅助翻译等技术的应用有效提升了翻译质量和效率。在全国翻译专业学位研究生教育指导委员会发布的《2023年翻译硕士专业学位授权点专项核验指标体系》中,“翻译技术应用”被纳 入“课程教学”的核验内容。翻译人才培养单位更加注重培养具有良好翻译技术能力的复合型人才,开始加强对翻译技术实操能力的训练。 随着翻译行业人机协作发展模式愈发明确,行业各方应切实深化政产学研用主体联动,促进跨领域、 跨学科融合发展,充分发挥生成式人工智能等新技术在助力跨语言国际交流等方面的重要作用,加强以中文为核心的行业基础设施建设,将科技创新的“最大变量”转化为推动发展的“最大增量”,让科学技术的智慧之光与人类主体的理性之光在新时代翻译行业交相辉映,加速推动翻译产业的数字化、智能化升级转型,探索中国翻译事业现代化的新篇章。 二、计算机辅助翻译概述 计算机辅助翻译(Computer-Aided/AssistedTranslation,CAT)在广义上涵盖了所有能够协助译员完成翻译工作的计算机工具,包括但不限于文字处理、格式转换以及电子词典等。在狭义上,计算机辅助翻译特指那些专为提升翻译效率、优化翻译流程而设计的专业计算机辅助翻译软件/系统。 计算机辅助翻译的核心之一是翻译记忆技术。与机器翻译不同,计算机辅助翻译并非直接将源语言转 换为目标语言,而是辅助译员开展翻译工作。译员可借助计算机辅助翻译软件/系统积累术语、建立和完善记忆库等,从而在后续翻译工作中提高翻译质量和效率。 (一)核心概念 计算机辅助翻译技术涉及多个核心功能,这些功能模块共同协作达到计算机辅助翻译的效果。 翻译记忆(TranslationMemory):翻译记忆是计算机辅助翻译软件/系统的关键组成部分,通过建立数据库来存储和检索已翻译过的句子或片段。当译员遇到相同或相似文本时,翻译记忆系统会自动检索并提供翻译建议,从而避免重复工作,提高翻译效率。 语料对齐(Alignment):语料对齐是将双语或多语材料以词句或段落为单位自动切分为翻译单位、 并依序匹配源语和目标语的人机交互半自动过程,其本质是建立源语与目标语词、短语、句、段等相同语言单位间的对应关系。语料对齐是依据现有翻译资源建立翻译记忆库的过程。 术语管理(TerminologyManagement):术语管理是计算机辅助翻译的重要环节,它允许译员集中管理和维护专业术语。通过术语管理,译员可确保整个翻译项目中术语的一致性和准确性,避免术语混淆或误用。 机器翻译(MachineTranslation):机器翻译是计算机辅助翻译的一项重要功能,它可以利用先 进的自然语言处理算法和大量语料数据自动将源语言文本翻译成目标语言。虽然机器翻译无法完全替代人工翻译,但它可以作为一个快速、初步的翻译工具,为译员提供参考和辅助。 译后编辑(Post-editing):译后编辑是机器翻译后的重要步骤,包含审查和修改机器翻译结果等步骤。译员需要仔细检查机器翻译的输出内容,修正其中的错误、不准确或不符合目标语言习惯的表达,以确保最终译文的准确性和流畅性。 质量保证(QualityAssurance):质量保证是计算机辅助翻译的一项重要功能,它能够对译文进行 自动检查,识别并指出可能存在的错误或疏漏之处。检查内容包括数字、空格、标记、术语一致性、漏译句段等。通过检查,译员可以及时发现并纠正错误,确保译文质量。 流程管理(ProcessManagement):流程管理可以提升翻译流程的自动化和标准化水平。典型的计算机辅助翻译流程包括文档预处理、切分与分析、翻译与编辑、质量保证、审校、后处理与导出等。 项目管理(ProjectManagement):项目管理是确保翻译流程高效、有序进行的关键环节。它涵盖 了从项目启动到交付的所有阶段,包括需求分析、任务分配、进度规划、资源管理(如翻译团队、翻译记忆库、术语库等)、质量控制和最终交付。计算机辅助翻译软件/系统通常会提供内置或集成的项目管理模块,帮助项目经理跟踪各个翻译任务的状态、监控任务进度,以及协调多语言、多译员之间的工作。 (二)发展历程 计算机辅助翻译发展主要经历了萌芽期、稳定发展期、迅猛发展期和蓬勃发展期四个阶段。 1.萌芽期(1967-1983) 1966年,美国科学院自动语言处理咨询委员会(AutomaticLanguageProcessingAdvisoryCommittee, ALPAC)发布的报告全面否定了机器翻译的可行性,并建议停止对机器翻译项目的资金支持,使得机器翻译研究遭到重创,人们转而开始寻求以其他方式提升翻译效率,研究可应用于机器翻译的语言和计算解决方案,这在一定程度上促进了基于语料库和统计学的翻译技术研究,为计算机辅助翻译奠定了基础。 翻译记忆的概念最早出现于1979年,当时被称为文本检索翻译(TranslationbyTextRetrieval)。多 层次的计算机辅助翻译系统的设想出现于1983年