安全GPT大模型对关键基础设施运营商的影响 及应对策略探讨 汇报人:蔡逆水 中国电信研究院安全技术研究所技术总监 目录 CONTENTS 一.安全GPT助力电信运营商云网安全的原理 二.电信运营商建设安全GPT的必要性 三.电信运营商安全 GPT大模型建设的核心能力要求和主要策略 —I 安全GPT助力电信运营商云网安全的原理 1..各类GPT技术发展迅猛 2..GPT对安全影响深刻 1..各类GPT技术发展迅猛 ChatGPT是OpenAI于2022年11月推出的一款聊天机器人,它是基于GPT-3.5模型的变体,可以在对话中根据上下文形成类似人类的文本响应。与其他使用预定义的响应或规则生成文本的聊天机器人不同,ChatGPT拥有更强的语言处理能力和生成能力,会根据接收到的输入生成更自然、更多样化的响应。 ChatGPT的发布让通用性大模型应用达到新的高潮。它可以完成聊天、撰写邮件、文案、代码等任务,应用于自然语言处理、写作辅助、智能对话、语言学习、创意产业、编程辅助等多个领域。 (1)资料查询好帮手,随身百科全书 遇到知识盲点,快速得到解答(以下是安全持久性内存知识点) (2)编程设计辅助高效率 Algorithm1:corealgorithmofcompliancematrixgenerationbasedonAIstructuredinterpretation Inthisimplementation,weuseaclasscalledPrivacyPolicyRuletorepresenteachrule.Wehavecreatedacategorylibraryandastructuredformatlibrary,andprocessedtheinputprivacypolicytext.Next,wecyclethrougheachrule,determineitscategory,selectthecorrespondingstructuredformat,andaddtheruletotherulelibrary.Finally,weprintouttherulelibrary. Algorithm2:DBSCANdensity-basedclusteringalgorithm ThisimplementationusestheDBSCANalgorithmfromthescikitlearnlibrary.Firstly,wecreatedadatasetcontainingnobjects.ThenwesettheparametersoftheDBSCANalgorithm,suchastheneighborhoodradiusparameterepsandtheneighborhooddensitythreshold min_samples。Next,weimplementedafunctioncalled dbscan,whichtakesthedataset,neighborhoodradius parameters,andneighborhooddensitythresholdasinputsandreturnsadensitybasedclusteringset.Finally,weprintouttheclusteringresults. Algorithm3:RandomForest Inthisimplementation,weusedtheRandomForestClassifierclassfromthescikitlearnlibrary.Firstly,weloadedtheirisdatasetanddivideditintotrainingandtestingsets.Then,wesettheparametersoftherandomforestalgorithm,suchasthenumberofdecisiontreesn_Estimators,maximumdepthofdecisiontreemax_DepthandSeedRandom ofRandomNumberGenerators_state。Then,weimplementedamethodcalledrandom_Forestreceives trainingdata,numberofdecisiontrees,maximumdepthandseedofrandomnumbergeneratorasinput,andreturnsatrainedrandomforestmodel.Next,weusethetrainingsettotrainthemodelandusethetestsettopredicttheclassificationresults.Finally,wecalculateandprintouttheaccuracyoftheprediction. (3)与通用GPT融合后,提升数据集质量和检测精度 个通用GPT大模型+个专用GPT大模型 (4)GPT对国家关键基础设施运营商的影响 电信运营商,作为国家关键基础设施运营商,遭遇的安全攻击也是最严重, 承载了更多做好安全防护的社会责任和要求 一方面,GPT应用于安全攻击带来了新的安全威胁,如对于深度伪造的舆情 安全威胁。 另一方面,GPT应用于安全防御展示了GPT可以极大提高安全运营的效率,增强企业的安全能力。 (5)安全GPT应用产品 在安全领域,GPT也已经有了较为成熟的应用产品。 国际,2023年3月28日,微软第一个发布了名为SecurityCopilot的新产品,该产品是基于GPT-4和自家训练的安全模型而开发的,旨在为安全人员提供快速、有效的网络安全事件信息收集、潜在威胁挖掘和常见漏洞查找工具。 国内,2023年5月18日,安全厂商深信服发布了国内首个企业级安全GPT云端大模型技术 应用深信服安全GPT(SecurityGPT),通过学习海量网络安全垂直领域专业知识和威胁情报, 大幅提升安全检测效果,增强安全运营效率和交互体验。在现场,深信服工作人员演示了安全GPT技术应用在XDR平台上的效果,包括高级威胁检测、安全监测调查、热门漏洞排查等。 2..GPT对安全影响深刻 (1))GPT助力安全 GPT技术在网络安全方面具有双重影响。 一方面,利用GPT技术,攻击者能够提升针对性的网络攻击能力: 生成恶意软件:GPT有二进制逆向能力和代码生成能力,攻击者可以利用ChatGPT编写恶意软件说明和指令,从而逃避防病毒软件的检测。 撞库攻击: 垃圾邮件和虚假信息: 创建虚假账户: 生成恶意自动消息: 另一方面,在对抗网络攻击中,合理使用ChatGPT可大幅减少安全运营工作量,作为辅助工具实现以下防御机制: 代码混淆解析 代码分析与审计 对抗训练 输入清洗 自动化运营 (2))GPT内生安全 GPT内生安全围绕着模型安全展开,自身模型安全问题主要包括针对机密性的攻击、针对完整性的攻击和针对可用性的攻击。 1.针对机密性的攻击模型,针对机密性的攻击可以分为训练数据窃取攻击和模型窃取攻击。其中,训练数据窃取攻击可以分为数据窃取攻击、特征推理攻击和成员推理攻击。 数据窃取攻击:在训练阶段,可能会选到由攻击者设计的恶意模型,将训练数据编码到模型参数中,攻击者通过解码参数窃取用户的隐私。在推理阶段,通过原始模型的模型接口进行查询,得到相应的预测结果,利用查询输入和预测结果训练得到一个与原始模型近似的替代模型,基于替代模型逆向恢复原始模型的训练数据。 模型窃取攻击: 特征推理攻击:成员推理攻击: 2.针对完整性的攻击模型,常见的针对大模型系统完整性的攻击包括投毒攻击和对抗攻击。投毒攻击:攻击者通过将精心制作的样本插入训练集中来操纵训练数据分布,以达到改变模型行为和降低模型性能的目的。 对抗攻击:通过向正常样本中添加精心设计的、人类无法感知的噪声来构造对抗样本,从而达到不干扰人类认知而促使机器学习模型对精心构造的对抗样本进行错误判断的目的。 3.针对可用性的攻击模型,通常发生在系统的推理或运行阶段。由于在推理阶段,系统可能会接收并处理大量的异常输入甚至恶意输入,因此模型的可用性可以成为攻击者的攻击目标,以迫使系统无法提供正常的服务。 (3))GPT衍生安全 1.社会工程问题,数据安全角度来看,攻击者可以利用从社交媒体或其他来源收集的大量文本数据来训练模型,生成极具说服力的网络钓鱼电子邮件或消息,诱骗受害者泄露敏感信息。 2.用户的隐私泄漏问题,ChatGPT的正常使用需要收集用户账户信息、对话相关的所有内容、以及交互中网页内的各种隐私信息,这些信息在被共享给供应商、服务提供商以及附属公司的过程中,有可能被攻击者截获,导致模型相关的隐私数据泄露,进而泄露用户隐私数据。 3.深度伪造的舆情安全问题,GPT类技术一旦被滥用,可能制造出较传统更以假乱真的文字,图片、声音、音视频等数据类型被深度伪造与合成,导致真实信息被严重歪曲,网络谣言四处传播,安全以及网络公共安全秩序造成极大的冲击。 4.ChatGPT带来的数据跨境安全风险问题 目录 CONTENTS 一.安全GPT助力电信运营商云网安全的原理 二.电信运营商建设安全GPT的必要性 三.电信运营商安全 GPT大模型建设的核心能力要求和主要策略 二I 电信运营商建设安全GPT的必要性 1..建设安全GPT有利于快速提升安全能力 2..电信运营商建设安全GPT大模型的优势 1..建设安全GPT有利于快速提升安全能力 (1)提升态势感知能力 威胁情报收集和分析:ChatGPT可以通过分析恶意软件、黑客活动、网络攻击等数据源,生成关于威胁情报的报告,帮助网络安全专家了解当前的威胁和趋势。 安全漏洞挖掘和修复:ChatGPT可以通过对已知的安全漏洞、代码缺陷和配置错误等进行分析和学习,帮助识别和修复类似的问题,提高系统的安全性。 自然语言处理安全:ChatGPT可以用于自然语言处理安全,例如识别和防止恶意语言、欺诈和网络钓鱼等攻击,保护用户的隐私和安全。 网络流量分析和安全监测:ChatGPT可以对网络流量进行分析和学习,识别异常流量和攻击,帮助网络安全人员及时发现和应对安全威胁。 (2)安全运营机器人 智能安全辅助决策:ChatGPT可以通过学习历史安全事件和安全策略,帮助网络安全团队进行智能决策,提高安全响应的速度和效率。 2..电信运营商建设安全GPT大模型的优势 在建设安全GPT方面,电信运营商拥有一体化的云网融合技术与综合智能的信息服务能力,在产业数字化演进方面具备丰富的安全技术手段与安全能力。 首先,知识优势。现有的态势感知系统拥有漏洞库、威胁情报库、安全风险判断规则库、AI智能安全模型和算法、重要数据分类分级规则库等,多类型的规则库为安全GPT提供了丰富的训练数据。 其次,数据优势。基于电信运营商的关键基础设施拥有实时流量数据、安全日志数据等,可作为安全GPT模型的优化依据,利用真实的现网流量信息将GPT模型进一步完善。 此外,行业优势。各类垂直行业的差异化应用丰富了现有的安全框架与安全解决方案,为安全GPT模型提供了面向2B的安全能力,增强了安全GPT的覆盖范围与应用场景;在智能化网络方面,电信拥有组网智能、响应智能、管理智能等成果。 最后,科研与创新能力是构建电信运营商的安全GPT大模型的有力支撑。 目录 CONTENTS 一.安全GPT助力电信运营商云网安全的原理 二.电信运营商建设云网安全GPT的必要性 三.电信运营商安全 GPT大模型建设的核心能力要求和主要策略 三I 电信运营商云网安全 GPT大模型建设的核心能力要求和主要策略 1..电信运营商安全GPT大模型建设的核心能