您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中国科学技术信息研究所]:学术出版中AIGC使用边界指南2.0 - 发现报告
当前位置:首页/行业研究/报告详情/

学术出版中AIGC使用边界指南2.0

学术出版中AIGC使用边界指南2.0

使用边界指南2.0 学术出版中 GuidelineontheBoundariesofAIGCUsageinAcademicPublishing2.0 中国科学技术信息研究所爱思唯尔、施普林格·自然、约翰威立国际出版集团 泰勒-弗朗西斯出版集团、威科集团、剑桥大学出版社(排名不分先后) 目录 1背景01 2目标02 2.1防范学术不端,加强科研诚信治理02 2.2引导相关利益主体就AIGC使用达成共识02 3原则02 3.1透明度和问责制02 3.2隐私和安全02 3.3公平02 3.4可持续发展03 4行为框架/实践指导03 4.1研究开展和论文撰写阶段03 4.1.1资料收集03 4.1.2统计分析04 4.1.3图表制作04 4.1.4文字撰写04 4.1.5语言和润色05 4.1.6引文整理05 4.2投稿阶段05 4.2.1作者署名05 4.2.2规范引用05 4.2.3披露和声明06 4.2.4同行评审06 4.3论文发表/出版后06 4.3.1数据仓储和共享06 4.3.2AIGC相关材料提交、存档06 4.3.3AIGC产生内容的检测和发现06 5案例分析07 5.1案例1:作者将道德和诚信问题归咎于ChatGPT07 5.2案例2:某医疗团队论文撤稿事件07 6总结07 7致谢08 背景学术出版中AIGC使用边界指南2.0 1背景 近年来,随着人工智能技术的迅速发展,特别是2022年11月人工智能聊天机器人ChatGPT的发布,人工智能内容生成(ArtificialIntelligenceGeneratedContent,简称AIGC)已经走进公众视野,并被广泛利用。人们清楚地认识到人工智能(AI)正在获得产生流利语言的能力,产生的大量语句越来越难与人写的文本区分开来。一些科学家已经在使用聊天机器人作为研究助手,帮助其组织思维,对他们的工作产生反馈,协助其编写代码并总结研究文献。AI在研究论文写作、创作等方面的影响不断增强,但是对学术研究的透明性、完整性产生重要影响,引起学术界的广泛关注。 学术界最担忧的是科学家、研究人员、学生等可能会欺骗性地将AIGC生成的文本作为自己的文本,或者简单使用AIGC并产生不可靠的研究成果。LLMs(LargeLanguageModels)通过学习大量在线文本数据库中的语言统计模式来工作,很容易产生错误和误导性信息,且可能无法显示其信息的来源。如果没有输出控制,AIGC很容易被用来产生不当言论或不可靠的研究结果,影响科研生态环境。同时,根据现有检测方法,使用AIGC还可能增加学术不端检测的难度(例如 抄袭和图像操纵检测)。因此,如何使用AIGC,设定界限并提供可参考的指南至关重要。 目前,一些国家科技管理机构、出版领域、期刊等针对AI技术在学术论文中的使用进行了研讨,并提供了一些相关的准则、指南等,例如国际出版伦理道德委员会(COPE),国际医学期刊编辑委员会 (ICMJE),国际科学、技术和医学出版商协会(STM),Taylor&Francis,Wiley,SpringerNature,Elsevier,WoltersKluwer等。值得注意的是,不同机构在不同时期发布的AI相关指南和规范性文件,有着不同的表述和要求,例如用于临床试验的CONSORT-AI;用于临床试验方案的SPIRIT-AI;用于预测模型的TRIPOD+AI等。为此,在广泛调研和梳理现有业内相关研究和探索工作的基础上,我们致力于为AI技术在学术出版中的最佳行为实践提供一个基本原则的框架和指南,希望能够引导出版界、科学界和科技管理部门就AI技术使用规范进一步形成共识。因为AI是一项新兴技术,技术的性质及如何使用将不可避免地发生变化,我们将根据情况变化,持续、及时更新这份指南。 01 目标丨原则 学术出版中AIGC使用边界指南2.0 2目标 2.1防范学术不端,加强科研诚信治理 以防范AIGC不当使用作为切入点,加强科研诚信意识教育,推进学术诚信治理,推进科研活动合法有序开展。 2.2引导相关利益主体就AIGC使用达成共识 明晰相关利益主体在学术期刊论文准备、研究和数据收集、写作、投稿、评审、出版、传播各环节应该履行的最佳行为实践,提供详尽、规范的AIGC使用指导。 3原则 3.1透明度和问责制 透明度和问责制是学术出版中AIGC使用最基本的原则。在学术研究到出版发行的过程中,所有应用功能使用者(包括研究人员、作者、同行评议人和读者)都应该了解并明确披露AIGC在其工作中的使用情况,应用程序提供者、技术开发者应该明确披露说明该应用程序接受过的数据训练、内容来源。透明度应该包括数据透明度(包括底层数据集、数据来源和数据处理方法),以及知识产权和版权材料的使用情况。问责制则是关键利益相关者应共同承担的责任,包括研究人员、研究机构、资助者、政策制定者和出版商,应建立问责标准和相关信息。 确保质量和诚信是在学术研究中AIGC应用建立信任的基础。从算法的设计和构建,到用于训练AIGC的输入,再到实际应用中使用的输入,应坚持问责和透明原则,并通过标识符或反馈等手段表明AIGC的使用,保证学术研究的质量和诚信不受AIGC技术使用的影响。 3.2隐私和安全 隐私和安全是AIGC使用的基本法律原则。在使用AIGC时应尊重隐私和数据保护,包括数据、隐私和安全影响评估,并通过适当的数据匿名来保护隐私,开展数据保护和安全措施来确保数据安全。作者还应遵守其所投稿的出版机构的特定隐私和保密政策。此外,使用大语言模型的用户应意识到,任何提交的信息可能会被抓取并用于训练模型,因此应采取必要的措施来保护敏感数据。 3.3公平 使用AIGC时应秉持公平原则,避免偏见。由于人工智能具有复制和放大偏差的风险,因此在训练数据选择、算法设计、模型生成和优化、使用过程中,应仔细评估和审查潜在的偏差来源,并建立反馈机制,监测和审查可能的不公平现象,及时纠偏。同时,AIGC能够帮助提供诸如语言润色等服务,减少此类文化或语言上的不公平现象。 02 原则丨行为框架/实践指导 学术出版中AIGC使用边界指南2.0 3.4可持续发展 AI系统的多学科性质使其非常适合解决全球关注的领域,如联合国可持续发展目标、碳中和等。它还为公共和私营组织提供了提高效率的机会,以实现更大的生态可持续性和责任。尽管AI系统承载着造福全人类,包括子孙后代的承诺,但我们也必须认识到训练和使用生成式AI的能源密集型性质,这对环境的影响不容忽视。为高质量输入数据的供应商提供资金和其他奖励措施, 如出版商创建的出版物和数据库,有助于提取重要的可采取行动的知识。 可持续发展应是AIGC本身的核心原则。为减少重复和浪费,使用AIGC应避免过度依赖可能暂时或永久不可用的数据,同时工具的功能模块应基于公认标准和指南,以确保数据可查找、可访问、可互操作和可重复使用。在这一过程中,应特别注意减少生成式AI对环境的影响,推动可持续的技术发展。 4行为框架/实践指导 AIGC可在研究开展及学术出版的各个阶段提供辅的决策,确定在研究中应包含哪些内容。 助作用(服务)。为了营造良好的科研氛围,防患于未然,避免/减少不当使用AIGC行为的发生,本部分提供一个行为框架,以帮助作者、研究机构、学术出版单位等就如何合规合理地使用AIGC做出指导。 4.1研究开展和论文撰写阶段 本部分以指导性建议为主,对研究人员投稿前的研究开展和论文撰写阶段使用AIGC提出建议。 4.1.1资料收集 AIGC所提供的资料是基于大数据和大语言模型生成和抽取的,其准确性和真实性缺乏考量和验证,需要研究人员确认内容的可靠性。 文献调研:可以借助AIGC收集关键词或主题相关已发表的参考文献,并进行分类和梳理,总结参考文献结论,为研究人员提供参考;帮助研究人员发现新的信息来源,并跟踪研究领域最新进展。需要注意的是,由于AIGC提供的参考文献可能是虚构或过时的,使用AIGC支持其文献综述的研究人员必须阅读并验证AIGC提供的每项建议和参考文献的真实性,并做出人为主导 概念解答:AIGC可以回答一些简单的概念问题,为研究人员在构建章节内容时提供帮助。但要注意,AIGC是基于语料库提供的概念解答,因此对任何AIGC的人工监督都是必不可少的步骤。 观点类资料调研:AIGC可以采集文本中公众或专家对某些主题的观点、情感及情感倾向的相关数据资料。研究人员必须监督和控制AIGC提供的观点资料,对AIGC提供的资料进行清洗处理,以确保研究人员使用的资料是有效、无偏的,防止传播不正确、有偏见或歧视性的信息。 4.1.2统计分析 某些情况下,研究人员已经收集了数据,但不确定用何种最佳的统计分析来验证其假设。研究人员可使用AIGC来选择最合适的分析方法或进行统计分析,但所用的数据必须是研究人员进行实验并收集的或其他合理方式获得的,并且研究人员需要对AIGC所提供的统计分析结果进行验证,确保统计结果的可靠性和有效性。 数据分析和解释:研究人员可以借助AIGC解释数据,计算统计学指标,进行一些简单的数据分析和统计 03 行为框架/实践指导 学术出版中AIGC使用边界指南2.0 结果的描述,但不能取代他们自己对数据的解释。 统计方法的建议和指导:AIGC可以根据问题和领域知识,为研究人员提供统计分析建议和指导,但只是基于其所学习的语言模型和知识库,可能存在缺失和不准确。因此,研究人员需甄别AIGC所提供的统计分析建议的可行性,结合其他可靠统计分析和数据挖掘工具进行判断,或向专业的领域专家寻求指导和帮助,最终判断是否采纳AIGC提供的建议。 4.1.3图表制作 图表和图像生成:根据数据特点和作图目的,AIGC可以依据不同的运用场景,推荐合适的统计图表类型,直观呈现数据结论,有效地传递信息,从而节省研究人员制作图表的时间,提高写作效率。但蛋白质印迹实验图、细胞技术分析、组织细胞染色图等实验生成类图像必须由真实开展的实验研究获得,不可通过AIGC直接生成。也不允许在图形摘要等艺术作品的制作中使用AIGC或AI辅助工具。在某些情况下,如果作者事先获得期刊编辑和出版商的许可,可以证明已获得使用相关材料的所有必要权利,并确保内容归属正确,则可能允许在封面艺术的制作中使用AIGC。 统计图表格式处理和优化:研究人员在处理和优化统计图表时,可以根据数据量和具体需求使用AIGC工具辅助调整图表样式。这些调整包括但不限于调整字体大小、添加或修改数据标注、添加图例、更改颜色等。这些优化措施旨在使图表更加清晰、美观,增强其可读性和易于理解性。同时,研究人员应确保在使用AIGC工具调整图表时,遵循规范操作,保证数据的真实性和准确性。 图像格式处理和优化:本条目涵盖的视频和动画 (包括视频静态图像)、摄影、科学图表、照片插图和其他拼贴画,以及编辑插图(如图画、卡通或其他二维或三维视觉觉表现形式)等图像类型。增强、模糊、移动、删除或引入图像中的特定特征是不可接受的。然而,只要亮度、对比度或色彩平衡的调整不会模糊或消除原始图像中的任何信息,则可以接受这些调整。同样,也可以接受添加图例和图像标注等修正。研究人员 在使用AIGC工具创建或更改图像内容时,需对所进行的修改进行详细描述,包括如何使用人工智能或人工智能辅助工具的具体过程,并提供所使用工具的名称、版本号和制造商信息,以确保透明度和可追溯性。 案例示范:AIGC在图表制作中的应用示例1:趋势分析 场景:需要展示过去十年某项技术的发展趋势。AIGC应用:AIGC工具可以根据提供的数据生成折 线图,自动调整图表的坐标轴、标注、图例等,以清晰展示趋势。 示例2:分类数据分析 场景:需要比较不同产品的市场份额。AIGC应用:AIGC工具可以根据分类数据生成柱状 图或饼图,推荐最适合的数据展示形式,自动设置图表颜色和标签,以便于解读。 示例3:学术报告图表美化 场景:需要在学术报告中展示研究结果,但图表样式不够美观。 AIGC应用:可以使