行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

生成式人工智能与虚假信息：最新进展、挑战和机遇

信息技术 2025-03-03 - - 土豆不吃泥

引言
生成式人工智能（AI）的易用性和低成本使其被广泛用于创建高度逼真的虚假信息，对选举和政治进程构成严重威胁。AI生成的图像、视频、音频和文本在社交媒体、广告和电子邮件中传播，影响公众舆论和民主信任。2024年欧洲选举预计将面临AI生成虚假信息的显著挑战，而社交媒体平台在检测和移除此类内容方面仍存在不足。
综合生成虚假信息的种类、普遍性和对选举的影响
- AI生成图像和视频：包括全合成图像（如使用GANs和扩散模型生成的人脸）、面部属性操纵（如年龄变化）、人脸互换、面部重演和唇语同步等。
- AI生成音频：基于端到端学习的语音合成技术（如TTS和VC）已实现高保真度，被用于制造虚假对话和声明。
- AI生成文本：大型语言模型（LLMs）如ChatGPT可生成流畅且具有说服力的虚假文本，被用于撰写新闻报道和传播误导性信息。
- 对2024年欧洲选举的威胁：多个案例显示AI生成内容被用于影响选民，如摩尔多瓦、斯洛伐克和保加利亚的选举中。AI生成内容通过低成本、高逼真度和协调一致的宣传手段，损害选举诚信和公众信任。
最近在检测综合生成虚假信息方面的进展
- 合成和操控的图像与视频：检测方法主要基于深度学习模型（如CNN和ViT），但泛化能力有限，误判问题突出。MINTIME架构等创新方法提升了多身份视频检测的鲁棒性。
- 音频深度伪造：检测技术包括反欺骗模型、情感识别和欺骗攻击检测系统，但缺乏稳健的数据集和通用模型。
- 机器生成文本虚假信息：检测方法包括基于文体学、深度学习和统计方法，但多语言检测能力不足，需更多数据支持。
AI辅助验证专业人士和公民的工具
- InVID-WeVerify插件：集成视频碎片化服务和OCR工具，帮助识别和验证可疑内容。
- 媒体专业人士辅导服务：AI工具如文本说服技巧检测器和ChatGPT风格验证助手，提升媒体对虚假信息的应对能力。
- 公民辅导服务：泰坦项目利用苏格拉底方法，通过LLMs提供批判性思维训练和媒体素养教育。
- 提升AI内容验证服务的透明度：需提供模型卡片、技术文档和用户指南，确保AI工具的可信赖性和可理解性。
虚假信息与生成AI交叉的伦理和法律问题
- 数据污染、版权关切和权力不平衡：生成式AI训练数据中可能包含未经授权的版权内容，加剧数据质量问题。大型科技公司主导AI发展，引发竞争和权力失衡问题。
- 生成AI使用产生的虚假信息风险：AI生成内容可能被用于情感操纵和个性化虚假信息，需加强监管和法律框架。
前方挑战
- 生成AI、幻觉和LLM训练数据的质量：LLMs易产生虚假信息和幻觉，需提升训练数据质量。
- 克服公民对AI的错误信任：公众难以区分AI生成内容，需加强媒体素养教育。
- 开发新的AI生成内容检测工具：需持续研发检测技术，应对AI生成内容的快速进化。
- 超越英语：多语言检测工具需求：低资源语言缺乏检测支持，需开发多语言工具。
- 研究人员对数据的访问：社交媒体数据访问受限，影响虚假信息研究。
- 研究资金匮乏：公司投入远超学术界，需更多资金支持研究。
机遇和下一步行动
- 欧盟需提供更好的数据访问和资金支持：推动社交媒体平台开放数据，建立共享的计算基础设施。
- 研究人员需加强合作：联合开发多语言数据集和开源工具，提升检测技术的有效性。
- 政策制定者需平衡创新与监管：确保AI技术发展符合伦理和法律要求，维护公众信任和民主进程。

编者致谢本工作由欧盟在“地平线欧洲 vera.ai”项目下共同资助，项目合同编号101070093，英国创新机构（Innovate UK）的10039055号拨款，以及瑞士联邦教育、研究与创新秘书处（SERI）根据合同编号22.00245资助；TITAN项目，项目合同编号101070658；AI4Media项目，项目合同编号951911；以及AI4Trust项目，项目合同编号101070190。校对和格式化乔安娜·赖特，谢菲尔德大学发布于2024年2月本白皮书在开放获取的许可下提供。创意共享署名-非商业性-禁止演绎4.0国际许可（CC BY-NC-ND 4.0 国际许可）) 目录 1. 引言 .................................................................................................................. 32. 综合生成虚假信息的种类、普遍性和对选举的影响 42.1 AI生成图像和视频............................................................................... 42.2 AI生成音频 .................................................................................................... 62.3 AI生成文本 ....................................................................................................... 82.4 对2024年欧洲选举构成的生成AI威胁：一个重要的案例研究................................................................................................................................ 93. 最近在检测综合生成虚假信息方面的进展 113.1 检测合成和操控的图像和视频 ...................................... 113.2 检测音频深度伪造 ...................................................................................... 133.3 检测机器生成的文本虚假信息............................................... 154. 选取的AI辅助验证专业人士和公民的工具 164.1 InVID-WeVerify插件 ............................................................................................. 164.2 基于AI的辅导媒体专业人士的服务............................................... 184.3 基于AI的辅导公民的服务 .................................................................. 194.4 提升AI内容验证服务的透明度 ......................... 205. 虚假信息与生成AI交叉的伦理和法律问题..... 215.1 数据污染、版权关注和权力不平衡.................................... 215.2 生成AI使用产生的虚假信息风险 ......................................... 226. 前方挑战...................................................................................................... 236.1 生成AI、幻觉和LLM训练数据的质量............................ 236.2 克服公民对AI的错误信任 .......................................................... 246.3 开发新的AI生成内容检测工具............................ 246.4 超越英语：需要新的多语言检测工具 ............................. 256.5 研究人员对数据的访问.............................................. 256.6 研究资金匮乏.................................................................................. 267. 机遇和下一步行动 .................................................................................... 26参考文献 .......................................................................................................................... 29 数字图5截图如前文所述的《连线》和《BR24》文章（4-5）......................................7图9截图显示OCR组件在Telegram帖子截图上运行，该帖子展示了克里姆林宫首席宣传员弗拉基米尔·索洛维约夫的一段虚假视频，其中检测到文本块、语言识别，以及一键将文本块发送到翻译引擎的可能性。........................................................................................................................... 17图 7: 从10个近期合成图像生成模型估计出的1000个图像残差中得出的人工指纹傅里叶变换（振幅）图，该图说明了由生成模型引入的特殊伪影。图源自（Corvi等，2023b）。······· 13图8截图显示的关键帧碎片化服务（在乌克兰战争期间被英国事实核查机构FullFact等辟谣的虚假视频之一）.......................... 17图 10:界面截图显示合成媒体检测器与一张虚假的美国总统乔·拜登在G20峰会期间疑似睡觉的照片。 ...................................... 18图6：概述MINTIME架构，该架构用于处理视频中的多身份深度伪造检测。图片来源于（Coccomini等，2022年）................................................ 12图1: 图像合成质量在近年来的演变。原始图片由Ian Goodfellow（GANs的创造者）发布于推文，随后由（Masood等人，2023年）扩展，进而再次扩展。 ...................................................................................................................................... 5图3使用MidJourney生成的成为主流的完全合成图像示例。讨论这些案例的文章：a) .................................................................... 6图2：示例：人脸重演、替换、编辑和合成深度伪造。图由（Mirsky & Lee，2021）提供。 ......................................................................... 6图 4截图如前所述的BBC、 Telegraph和Tagesschau文章（1-3）................................................................................................................................................ 7 1. 引言在过去三年中，生成式人工智能技术（例如DALL-E，ChatGPT）突然从研究论文和企业实验室跳跃到数亿人使用的在线服务中，其中包括学生。仅在美国，根据皮尤研究机构在2023年7月的数据，18%的成年人使用过ChatGPT（）。帕克、盖尔斯-沃尼克，2023). 随着生成式人工智能的流畅性和可负担性逐月提升，其被广泛用于创建低成本、高度可信的大规模虚假信息运动的滥用现象也在增加。AI生成虚假信息的严重例子比比皆是，包括非常有利可图的Facebook广告。1试图通过假的关于摩尔多瓦亲西方总统的视频来影响选民（吉尔伯特，2024). YouTube还被发现托管了带有政治深度伪造视频的广告，这些视频使用了声音模仿技术（RTL Lëtzebuerg, 2023）。除了视频之外，人工智能生成的图像也被用来传播加沙地区的虚假信息（。法国，2023;托斯，2023括号和传播分化的、反移民的叙述《期刊，2023》). 深度伪造音频也被事实核查者报道，迄今为止，这些主要关注政治家的虚假对话和声明（民粹主义者，2023;Dobreva, 2023;博塞夫，2023). 俄罗斯也武器化了生成式人工智能（例如，一段深度伪造的乌克兰总统呼吁投降的视频）。金塞拉，2023) 一个乌克兰总统及其妻子之间的人工智能生成对话（民粹主义者，2023). 被针对的国家涵盖了整个欧洲联盟（甚至更远），包括高度易受影响的地区，如保加利亚（）。博塞夫，2023;BNT, 2023在公民媒体素养和批判性思维技能水平较低，以及对存在复杂的AI生成图像、视频、音频和文本的认识不足的地区。平台针对在帖子中及广告中对抗虚假信息的行动，迄今为止在检测和移除有害的人工智能生成内容方面也未能达到预期效果。所有主要社交媒体平台和聊天应用都受到了影响。为了简洁，以下仅列出一些来自Facebook的示例（广告（吉尔伯特，2024), 群组 (《期刊，2023》)，页码（）博塞夫，2023))) YouTube (RTL Lëtzebuerg, 2023），X（）法国，2023;托斯，2023)，Instagram（）法国，2023;托斯，2023)，抖音（TikTok）（）AFP, 美国 & AFP 德国，2023;Marinov, 2023）和Telegram（Starcevic, 2023;Marinov,2023). AI 生成内容（例如，声称在保加利亚操纵选票的虚假音频）Dobreva, 2023))) 也正通过电子邮件发送给媒体和记者，意图诱骗可信的机构发布虚假内容。此外，不仅生成式AI被用于低成本地创建高度欺骗性的虚假信息宣传活动，其存在和能力还被那些传播虚假声明的行为者武器化，他们宣称来自政府和主流媒体的原始图像、视频和音频内容实际上是伪造的。一个最近的例子是针对特斯拉的一场法庭诉讼，在该案件中，公司律师声称一段埃隆·马斯克的视频是深度伪造（deepfake）。《卫报》& 路透社，20

点击免费查看完整报告

生成式人工智能与虚假信息：最新进展、挑战和机遇

你可能感兴趣

生成式AI在K-12教育中的挑战和机遇

新能源汽车行业的税务挑战和机遇：研发与生产

新能源汽车行业的税务：税务评论，挑战和机遇，分销与补贴政策

韩国在美国与中国的竞争中面临的挑战和机遇

AI谣言研究报告·生成式AI与算法放大驱动的虚假信息治理框架

生成式人工智能时代的多目标推荐：最新进展与未来展望综述

商业生成式AI：成功、挑战和未来 (英)

在东盟加速人工智能：解决差距、挑战和区域政策需要

CPG 行业的采购：主要挑战和价值机遇

金融和专业服务：大流行后的贸易挑战和机遇

生成式人工智能与虚假信息：最新进展、挑战和机遇

你可能感兴趣

生成式AI在K-12教育中的挑战和机遇

新能源汽车行业的税务挑战和机遇：研发与生产

新能源汽车行业的税务：税务评论，挑战和机遇，分销与补贴政策

韩国在美国与中国的竞争中面临的挑战和机遇

AI谣言研究报告·生成式AI与算法放大驱动的虚假信息治理框架

生成式人工智能时代的多目标推荐：最新进展与未来展望综述

商业生成式AI：成功、挑战和未来 (英)

在东盟加速人工智能 ： 解决差距、挑战和区域政策需要

CPG 行业的采购 ： 主要挑战和价值机遇

金融和专业服务 ： 大流行后的贸易挑战和机遇

在东盟加速人工智能：解决差距、挑战和区域政策需要

CPG 行业的采购：主要挑战和价值机遇

金融和专业服务：大流行后的贸易挑战和机遇