使用边界指南 学术出版中 GuidelineontheBoundariesofAIGCUsageinAcademicPublishing 中国科学技术信息研究所爱思唯尔、施普林格•自然、约翰威立国际出版集团(排名不分先后) 我很高兴看到中信所联合爱思唯尔、约翰威立、施普林格·自然等国际出版机构制定本指南。这份指南为论文作者、研究机构、学术期刊出版单位等如何负责任地使用AIGC提出了建议,包括如何对AIGC使用情况进行充分、正确的披露和声明。因为AIGC的使用是一个非常动态的领域,STM也希望各方献计献策以适应未来。在现阶段本指南是务实且有作用的。 ——颜帅(国际科学、技术与医学出版商协会中国顾问) 随着生成式人工智能在关注度和使用上的加速发展,施普林格·自然很高兴参与制定关于这一重要课题的指南。由于该技术功能强大,我们需要去理解预期和非预期的后果,并因此谨慎小心地行事。同样需要注意的是,鉴于该技术的迭代特性,这份指南也是迭代的,将随着该技术本身的发展,包括与之相关的挑战和益处,而持续发展。 ——StevenInchcoombe(施普林格·自然科研总裁) 生成式人工智能(GenerativeAI)为未来科学研究和学术出版带来了广阔的前景和机遇。然而,鉴于其迅猛的发展速度,我们需要展开深入的探讨和对话,以解决从科研到出版过程中各个利益相关方应如何在确保诚信和透明原则下运用这项技术的问题。在这个背景下,这份指南对于提高人们对使用这项新技术所涉及问题的认识非常重要,同时也强调了人工智能技术在实际应用中问责制的重要性。 ——MichaelStreeter(约翰威立国际出版集团科研诚信政策与战略总监) 爱思唯尔非常欢迎由中国科学技术信息研究所(ISTIC)牵头的这一重要倡议,即制定在学术出版中AIGC技术的使用指南。我们很高兴有机会为该技术使用指南做出贡献,并分享我们自己的经验。 正如指南中所指出的,人工智能在学术和学术出版领域的影响与日俱增,同时也带来了机遇和挑战。爱思唯尔的政策侧重于负责任地使用人工智能,以及在作者使用人工智能协助其文章写作过程时披露相关信息的必要性,同时我们的政策强调在审稿人和编辑使用人工智能时保护作者和数据的保密性和隐私权。在所有情况下,我们都需要为作者、读者、审稿人、编辑和投稿人提供透明度和指导。ISTIC的这份指南是非常关键的,它将有助于学界以负责任的、透明的和可问责的方式来使用人工智能。 ——SarahJenkins(爱思唯尔研究诚信与出版伦理部总监) 目录 1背景01 2目标02 2.1防范学术不端,加强诚信治理02 2.2引导相关利益主体就AIGC使用达成共识02 3原则02 3.1透明度和问责制02 3.2质量和诚信02 3.3隐私和安全02 3.4公平03 3.5可持续发展03 4行为框架/实践指导03 4.1研究开展和论文撰写阶段03 4.1.1资料收集………………………………………………………………………………………… 03 4.1.2 统计分析 ………………………………………………………………………………………… 04 4.1.3 图表制作 ………………………………………………………………………………………… 04 4.1.4 文字撰写 ………………………………………………………………………………………… 04 4.1.5 语言和润色……………………………………………………………………………………… 05 4.1.6 引文整理………………………………………………………………………………………… 05 4.2投稿阶段05 4.2.1作者署名05 4.2.2规范引用05 4.2.3披露和声明05 4.2.4同行评审06 4.3论文发表/出版后06 4.3.1数据仓储和共享06 4.3.2AIGC相关材料提交、存档06 4.3.3AIGC产生内容的检测和发现06 5总结07 6致谢08 1 背景 近年来,随着人工智能技术的迅速发展,特别是2022年11月人工智能聊天机器人ChatGPT的发布,人工智能内容生成(ArtificialIntelligenceGeneratedContent,简称AIGC)已经走进公众视野,并被广泛利用。人们清楚地认识到人工智能(AI)正在获得产生流利语言的能力,产生的大量语句越来越难与人写的文本区分开来。一些科学家已经在使用聊天机器人作为研究助手,帮助其组织思维,对他们的工作产生反馈,协助其编写代码并总结研究文献。AI在研究论文写作、创作等方面的影响不断增强,但是对学术研究的透明性、完整性产生重要影响,引起学术界的广泛关注。 学术界最担忧的是科学家、研究人员、学生等可能会欺骗性地将AIGC生成的文本作为自己的文本,或者简单使用AIGC并产生不可靠的研究成果。LLMs(LargeLanguageModels)通过学习大量在线文本数据库中的语言统计模式来工作,很容易产生错误和误导性信息,且无法显示其信息的来源。如果没有输出控制,AIGC很容易被用来产生不当言论或不可靠的研究结果,影响科研 生态环境。同时,使用AIGC还可能增加学术不端检测的难度(例如抄袭和图像操纵检测)。因此,如何使用AIGC,设定界限并提供可参考的指南至关重要。 目前,一些国家科技管理机构、出版领域、期刊等针对AI技术在学术论文中的使用进行了研讨,并提供了一些相关的准则、指南等,例如国际出版伦理道德委员会(COPE),国际医学期刊编辑委员会(ICMJE),国际科学、技术和医学出版商协会(STM),Taylor&Francis,Wiley,SpringerNature,Elsevier等。值得注意的是,不同机构在不同时期发布的AI相关指南和规范性文件,有着不同的表述和要求。为此,在广泛调研和梳理现有业内相关研究和探索工作的基础上,我们致力于为AI技术在学术出版中的最佳行为实践提供一个基本原则的框架和指南,希望能够引导出版界、科学界和科技管理部门就AI技术使用规范进一步形成共识。因为AI是一项新兴技术,技术的性质及如何使用将不可避免地发生变化,我们将根据情况变化,持续、及时更新这份指南。 2目标 2.1防范学术不端,加强诚信治理 以防范AIGC不当使用作为切入点,加强科研诚信意识教育,推进学术诚信治理,推进科研活动有序开展。 2.2引导相关利益主体就AIGC使用达成共识 明晰相关利益主体在学术期刊论文准备、写作、投稿、评审、出版、传播各环节应该履行的最佳行为实践,提供详尽、规范的AIGC使用指导。 3原则 3.1透明度和问责制 透明度和问责制是学术出版中AIGC使用最基本的原则。在学术研究到出版发行的过程中,所有参与者(包括研究人员、作者、同行评议人和读者)都应该了解并明确披露AIGC的使用情况,透明度应该包括数据透明度(包括底层数据集、数据来源和数据处理方法),以及知识产权和版权材料的使用情况。问责制则是关键利益相关者应共同承担的责任,包括研究人员、资助者、政策制定者和出版商,应建立问责标准和相关信息。 3.2质量和诚信 确保质量和诚信是在学术研究中AIGC应用建立信任的基础。从算法的设计和构建,到用于训练AIGC的输入,再到实际应用中使用的输入,应坚持问责和透明原则,并通过标识符或反馈等手段表明AIGC的使用,保证学术研究的质量和诚信不受AIGC技术使用的影响。 3.3隐私和安全 隐私和安全是AIGC使用的基本法律原则。 原则|行为框架/实践指导学术出版中AIGC使用边界指南 在使用AIGC时应尊重隐私和数据保护,包括数据、隐私和安全影响评估,并通过适当的数据匿名来保护隐私、数据保护和安全措施来确保数据安全。 3.4公平 使用AIGC时应秉持公平原则,避免偏见。由于人工智能具有复制和放大偏差的风险,因此在训练数据选择、算法设计、模型生成和优化、使用过程中,应仔细评估和审查潜在的偏差来源,并建立反馈机制,监测和审查可能的不公平现象,及时纠偏。同时,AIGC能够帮助提供诸如语言润色等服务,减少此类文化或语言上的不公平现象。 3.5可持续发展 AI系统的多学科性质使其非常适合解决全球关注的领域,如联合国可持续发展目标、碳中和等。它还为公共和私营组织提供了提高效率的机会,以实现更大的生态可持续性和责任。AI系统承载着造福全人类,包括子孙后代的承诺。为高质量输入数据的供应商提供资金和其他奖励措施,如出版商创建的出版物和数据库,有助于提取重要的可采取行动的知识。 可持续发展应是AIGC本身的核心原则。为减少重复和浪费,使用AIGC应避免过度依赖可能暂时或永久不可用的数据,同时工具的功能模块应基于公认标准和指南,以确保数据可查找、可访问、可互操作和可重复使用。 4行为框架/实践指导 AIGC可在研究开展及学术出版的各个阶段提供辅助作用(服务)。为了营造良好的科研氛围,防患于未然,避免/减少不当使用AIGC行为的发生,本部分提供一个符合道德行为的框架,以帮助作者、研究机构、学术期刊出版单位等就如何合规合理地使用AIGC做出指导。 4.1研究开展和论文撰写阶段 本部分以指导性建议为主,对研究人员投 稿前的研究开展和论文撰写阶段使用AIGC提出建议。 4.1.1资料收集 AIGC所提供的资料是基于大数据和语言模型生成和抽取的,其准确性和真实性缺乏考量和验证,需要研究人员确认内容的可靠性。 文献调研:可以借助AIGC收集关键词或主题相关参考文献,并进行分类和梳理,总结参考文 行为框架/实践指导学术出版中AIGC使用边界指南 献结论,为研究人员提供参考;帮助研究人员发现新的信息来源,并跟踪研究领域最新进展。需要注意的是,由于AIGC提供的参考文献可能是虚构或过时的,使用AIGC支持其文献综述的研究人员必须阅读并验证AIGC提供的每项建议和参考文献的真实性。 概念解答:AIGC可以回答一些简单的概念问题,为研究人员在构建章节内容时提供帮助。但要注意,AIGC是基于已有研究提供的概念解答,研究人员在使用时要注意概念的适用性。 观点类资料调研:AIGC可以采集文本中公众或专家对某些主题的观点、情感及情感倾向的相关数据资料。研究人员必须监督和控制AIGC提供的观点资料,必要时对AIGC提供的资料进行清洗处理,以确保研究人员使用的资料是有效、无偏的,防止传播不正确、有偏见或歧视性的信息。 4.1.2统计分析 某些情况下,研究人员已经收集了数据,但不确定用何种最佳的统计分析来验证其假设。研究人员可使用AIGC来选择最合适的分析方法或进行统计分析,但所用的数据必须是研究人员进行实验并收集的,并且研究人员需要对AIGC所提供的统计分析结果进行验证,确保统计结果可靠性。 数据分析和解释:研究人员可以借助AIGC解释数据,计算统计学指标,进行一些简单的数据分析和统计结果的描述,但不能取代他们自己对数据的解释。 统计方法的建议和指导:AIGC可以根据问题和领域知识,为研究人员提供统计分析建议和指导,但只是基于其所学习的语言模型和知识库,可能存在缺失和不准确。因此,研究人员需甄别AIGC所提供的统计分析建议的可行性,结合其他可靠统计分析和数据挖掘工具进行判断,或向专业的领域专家寻求指导和帮助,最终判断是否采纳AIGC提供的建议。 4.1.3图表制作 辅助生成图表:根据数据特点和作图目的,AIGC可以依据不同的运用场景,推荐合适的统计图表类型,直观呈现数据结论,有效地传递信息,从而节省研究人员制作图表的时间,提高写作效率。但蛋白质印迹实验图、细胞技术分析、组织细胞染色图等实验生成类图像必须由真实开展的实验研究获得,不可通过AIGC直接生成。 图表格式处理和优化:根据数据量和图表需求,研究人员可以使用AIGC辅助调整图表样式,对图表进行格式化处理,例如调整字体大小、数据标注、添加图例、更改颜色等,使图表更清晰、美观,更易于理解。 4.1.4文字撰写 在论文撰写过程中,AIGC可用于提高文本可读性、启