安全行业大模型 SecLLM技术白皮书 SecurityLargeLanguageModel,SecLLM 大模型赋能网安新范式,人工智能安全可信护航 *NSFOCUS NSFOCUS 关于绿盟科技 绿盟科技集团股份有限公司(以下简称绿盟科技),成立于2000年4月,总部位于北京。公司于2014年1月29日在深圳证券交易所 创业板上市,证券代码:300369。绿盟科技在国内设有50余个分支机构, 为政府、金融、运营商、能源、交通、科教文卫等行业用户与各类型企 业用户,提供全线网络安全产品、全方位安全解决方案和体系化安全运营服务。公司在美国硅谷、日本东京、英国伦敦、新加坡及巴西圣保罗 设立海外子公司和办事处,深入开展全球业务,打造全球网络安全行业 的中国品牌。 版权声明 为避免合作伙伴及客户数据泄露,所有数据在进行分析前都已经过匿名化处理,不会在中间环节出现泄露,任何与客户有关的具体信息,均不会出现在本报告中。 NSFOCUS 01 新趋势:ChatGPT技术加速安全革命 02 新范式:安全行业大模型核心框架8 2.1安全模型发展面临困境9 2.2安全模型✁研究新范式10 2.3安全行业大模型✁升级技术11 2.4安全行业大模型✁分层框架13 03 新技术:安全行业大模型关键技术17 3.1数据增强:高质量安全语料双飞轮18 3.2训练加速:高效并行加速增量训练19 3.3任务微调:安全下游任务高效微调20 3.4推理加速:多维优化推理任务加速21 3.5内容管控:人机对齐内容安全管控22 3.6工具协同:复杂任务安全工具学➀24 3.7私有部署:安全模型私域私密交互25 04 新实践:安全行业大模型赋能应用27 4.1研究:专业沉淀,智能问答28 CONTENTS 4.2情✲:信息整合,情✲挖掘33 4.3攻防:模拟演练,辅助决策39 4.4运营:人机协作,提升效率51 05 新安全:大模型安全风险与防护策略 5.1大模型安全框架62 5.2大模型安全风险64 5.3大模型安全防护策略68 06 结语75 07 参考文献77 执行摘要 在ChatGPT呈现全球现象级热度时,通用大语言模型(LargeLanguageModel,LLM)技术 成为了推动创新和变革的关键驱动力。但由于安全行业的特殊性和复杂性,LLM并不能满足其应用需求。因此,绿盟科技基于“人工智能+安全”多年积累的安全专业经验和高质量数据,稳扎 稳打地推出安全可信的安全行业大模型(SecurityLargeLanguageModel,SecLLM)。SecLLM目 标是智能化解决攻防实战场景中所面临的复杂安全问题,提供更专业、高效和定制化的威胁应对和安全防御能力,更好地满足安全行业的特殊需求,为安全行业提供量身定制的大模型解决方案。 绿盟科技同步推出安全行业大模型技术白皮书《大模型赋能网安新范式,人工智能安全可信 护航》,分享绿盟在SecLLM研发过程中所积累的最佳实践和经验教训,并探讨其在安全领域的重要性和价值。本技术白皮书从SecLLM的研究新趋势、新范式、新技术、新实践和新安全几方面展开探讨。主要观点如下: 大模型赋能网安新范式:SecLLM应用于安全行业,充分利用其强大的学习和适应能力, 能够在复杂的攻防实战中逐步学习并提升威胁检测和防御能力,为网络安全提供更智能 和更高效的解决方案。SecLLM引领了一系列技术突破,解决了传统安全方法在应对复 杂威胁和新型攻击时的局限性,为安全行业带来斩新的发展方向和范式。 高质量数据助力成功落地:安全行业真正有价值的安全数据和知识无法从公开渠道获取。绿盟科技所特有的安全经验、知识和数据的积累,有助于训练大模型更好地理解和学习各种安全特征和行为模式,从而提高威胁检测和防御的准确性和效率,更好地适应 特定的安全需求。 实战化攻防推动学习成长:SecLLM实践出真知,从实验室走入实战化的安全攻防场景 中,参与常态化的安全运营,辅助安全监测中复杂问题的解决。通过不断助力解决实际 难题,促进SecLLM自我学习和安全能力的持续提升,增强其在实际应用中的可靠性和 实用性。 人机协作增强安全动能:SecLLM转化为安全人员的“伙伴”,快速融入已有的智能安 全运营、威胁情报分析、零日攻击和新型威胁应对等日常安全处置工作流中,提升安全 信息处理和分析、智能安全建议和反馈等能力,与安全人员紧密协作,共同应对不断升 级的安全威胁。 云端服务结合本地部署:SecLLM提供云端服务和本地私有部署两种方式。云端MaaS 服务享受节约资源、简化管理和覆盖全球等优势;本地化部署提供了更高的定制性、控 制权和数据隐私保护。两种方式可以相互配合或独立应用。 人工智能护航安全可信:大模型自身安全的保障是应用LLM和SeCLLM等大模型的必要 条件,保护用户隐私和数据安全,防止大模型被用,预防新型攻击和未知威胁,从而 保障大模型自身的安全可靠性,推动SecLLM成为安全护航的可信之选 绿盟科技将持续投入研发和创新,不断优化SecLLM的功能、性能和自身安全性,提供更具创新型和实用性的安全解决方案。SecLLM作为每一个用户定制化的安全协作“伙伴”,致力于 成为各行业持久可信的安全护卫。在该过程中,绿盟科技愿意贡献自身能力,与各行业合作伙伴 共同应对日益复杂的安全挑战,携手促进安全行业大模型生态建设。通过积极交流合作,共享安 全专业知识和技术经验,共同促进“人工智能+安全”的加速发展。 术语和定义 够模拟、模仿和执行人类智能活动的技术和系统,使其具备像人类一样的智能。人工智能按发展程度可以分为狭义人工智能、通用人工智能和超级人工智能。 通用人工智能(ArtificialGeneralIntelligence,AGI):是指一种具有类似于人类智能的智 能系统。它具有感知、认知、思考、学习和创造等能力,能够在各种不同领域和任务上表现出类 似于人类的智能水平。 大语言模型(LargeLanguageModel,LLM):是指具有巨大参数量和复杂结构的自然语言 处理模型。这类模型利用深度学习技术,能够在大规模的文本数据上进行预训练,并通过微调等 技术完成各种自然语言处理任务。 行业大模型(lndustry-specificLargeModel):是基于特定行业的大规模数据构建的大模型。 学习特定行业的特征和规律,以实现在该行业中高准确性和可靠性的分析和预测,能够更好地适 应特定行业的需求。 预训练语言模型(Pre-trainedLanguageModel,PLM):是指在大规模语料库上以无监督 方式进行预训练的语言模型。在大量的未标记数据上进行预训练,大模型得以学习数据的内在表 示和特征。 微调(Fine-Tuning,FT):是指基于已经训练好的预训练语言模型,在有标注数据上进行有 监督的学习。目的是让模型通过学习激活特定能力以适应特定的任务和场景。 推理(ModelInference,MI):是指使用训练好的模型对新的数据进行预测或分析的过程。 目的是模型应用于实际任务中,利用其学习到的能力,快速、高效地对未知数据进行计算和处理, 以获得预测的结果。 模型即服务(ModelasaService,Maas):是指基于云计算提供一种将人工智能模型转换 为可重复使用服务的方式,实现模型的快速部署、弹性伸缩和按需使用,允许用户不需要硬件设 备和专业技能情况下可以使用模型。 人工智能安全(ArtificialIntelligenceSecurity):是指针对人工智能算法和系统在设计、实 现、训练和应用等全生命周期中可能面临的各种风险和威胁进行安全防护,促进人工智能的可靠、 可控、可信和可持续发展的过程。 01 新趋势: ChatGPT技术 加速安全革命 ·NSFOCUSI安全行业大模型SecLLM技术白皮书 ChatGPT爆火背后的推动力是通用大语言模型(LargeLanguageModel,LLM)。LLM 是指具有巨大参数量和复杂结构的自然语言处理模型。这类模型是深度学习在自然语言处理领域的典型技术范式,能够在大规模的文本数据上进行预训练,并通过微调等技术完成各种自然语言处理任务。“读书破万卷,下笔如有神”在一定意义上反映了LLM的运作模式。LLM是具备强大表示能力和广泛适用性的模型,一个模型就能够处理各种自然语言处理任务。LLM的关键发展可以追溯到2018年,彼时GoOgle推出了BERT模型。BERT采用了预训练 加微调的方法,通过在大规模数据上进行预训练,模型学习到了广泛的语言知识,然后在特定任务上微调模型参数。BERT在多个任务上取得了优异的表现,引发了全球各大公司、研究机构对通用大模型的普及应用。同时,ChatGPT作为现象级的LLM,为学术界和工业界 呈现了一种通用大模型技术实现的技术路径。ChatGPT的发展(图1)经过了多个版本的技 术选代演化,在保持Transformer核心特征抽取结构框架的同时,模型的整体参数规模、训 练数据规模呈现爆炸式增长。现阶段,典型LLM的参数规模已达到千亿级别。这些模型不仅在表现上超越了之前的模型,同时也具备更高效的训练和推理能力,可以处理更加复杂的 任务。 T5GGShardPubliclyAvailable 2019 2020 2021 GmT5业PanGu-α Ernie3.0 GPT-3 2 Codex GFLAN PLUG A121Jurassie-1 BAAICPM-2 TO# 9-10LaMDA AI inspurYuan1.0 Anthropic HyperCLOVANAVER 6 AlphaCode WebGPT Ernie3.0Titan ,11-12 1 2022 Chinchilla TIDFalcon CodeGeex InstrucIGPT Gopher6 CodeGenGUL2 Sparrow Pythia GLaM MT-NLG OPT8 GPaLMGFlan-T5 uM-sysVicuna YaLMG Flan-PaLM WPanGu-E BLOOM mTO BLOOMZ GPT-NeoX-20B GLMTk-InstructAi2 Cohere WeLM 水Luminous 8NLLB 11-12 2023 GBard COLLaMA Galatica00 OPT-IMLO0ChatGPTt-ld 图1大语言模型发展历程[1] 随着模型参数规模和训练数据规模的爆炸式增长,通用大语言模型LLM的涌现能力 6 新趋势:ChatGPT技术加速安全革命W (EmergentAbility)凸显。相对于经典规模尺度较小的机器学习或深度学习模型,LLM在上 下文学习(In-ContextLearning)、复杂推理、知识容量、泛化性等方面的能力大幅提升。那么: ·知识语义增强:通过在大规模通用文本数据上进行训练,LLM得以掌握广泛的语言知识和语义理解能力。相较于小模型,LLM能够更全面地理解词汇、句法和语用,生成的文本更加准确、连贯,同时保留了语义特征。在安全行业中,知识语义增强有助于理解和分析安全领域特定的数据内容,如安全威胁、漏洞、攻击技术等相关知识和安全语义,从而更为准确地识别风险、提供建议或生成报告。 逻辑分析增强:LLM可以理解和应用逻辑原则来推理和分析输入文本中的信息。相较于小模型,LLM经过训练可以更好地理解和应用逻辑规则,能够产生更为合乎逻 辑的输出结果。在安全行业中,逻辑分析增强可以更好地分析不同事件之间的关系、 理解上下文相关性、挖掘潜在的威胁情报等,进一步推断可能的攻击路径和攻击团伙 并分析推荐可采取的安全措施。 ·交互决策增强:LLM在与用户的交互过程中表现出更高水平的决策能力和响应性能。 相较于小模型,LLM可以更好地根据输入的上下文和目标指令,综合利用所学习到的语言知识、语义理解能力以及可能的逻辑推理和决策策略,生成更智能和个性化的回复,这使得LLM在对话