您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[欧洲研究理事会(ERC)]:远见 : 人工智能在科学过程中的使用和影响 - 发现报告
当前位置:首页/行业研究/报告详情/

远见 : 人工智能在科学过程中的使用和影响

远见 : 人工智能在科学过程中的使用和影响

远见: 人工智能在科学过程中的使用和影响 2023 内容表 1.过程5 2.应用6 3.挑战8 上下文3 方法3 I2 4.AI11 外卖12 参考文献13 致谢13 调查14 上下文 欧洲研究委员会(ERC)是欧洲顶尖的研究前沿资金组织。自2007年成立以来,ERC在欧盟的研究与创新资助计划中扮演了关键角色。ERC致力于培养卓越性,为其获得者提供了发展雄心勃勃研究项目自由度。这些项目有可能推动知识前沿的进步,并为整个欧洲的前沿研究设定明确且鼓舞人心的目标。 欧洲研究委员会(ERC)资助了一个丰富且多样的项目组合,横跨所有科学和学术领域,没有任何预设的学术或政策优先级。这些项目的影响可能远远超出科学范畴,提供前沿知识与创新,以助于解决社会挑战,并且为塑造和指导关键的欧盟政策目标提供洞见。 本报告强调了欧盟研究委员会(ERC)资助的研究人员如何在他们的科研过程中应用人工智能(AI),以及他们对2030年AI潜在影响的看法。该报告总结了一项前景调查的结果,该调查针对的是ERC资助者当前使用AI的情况、他们对未来发展至2030年的观点、潜在的机会与风险,以及生成式AI在科学领域的影响,尤其是大型语言模型(LLMs)。此报告是在与研究与创新总司(R&I)及其科学政策、建议与伦理/科学建议机制(SAM)合作下开发的,背景为即将到来的关于科学中负责任地采纳AI的科学意见(更多信息见下方)。其目的是提供证据,以供制定和实施与科学领域AI相关的政策时参考。 在欧洲和国际层面,人工智能在科学与学术实践中的应用仍然是一个持续的学术和政策辩论的话题(《自然》2023年 ,经合组织2023年,Birhane等人2023年,vanDis等人2023年)。AI的应用覆盖了多个学科领域,并服务于多种目的,包括大规模数据处理、模式和预测生成、实验设计与控制,以及撰写和同行评审科学论文或项目提案。在这些上下文中的实际效果、潜在影响和缺点的讨论广泛存在。 这一话题成为了欧洲委员会政策倡议的核心内容,该倡议专注于人工智能(AI)对研究与创新(R&I)的影响(Arranz等,2023b)。在能为政策制定提供信息的研究方面,欧盟委员会信息与通信技术(CORDIS)成果包展示了关于AI在科学领域应用的一系列欧盟资助项目(包括8个欧洲研究委员会(ERC)项目)。此外,预计于2024年初发布的由欧洲研究委员会执行局(ERCEA)开展的前沿研究地图(MFR)报告,将在其向政策反馈(F2P)活动框架内增强这些努力,这是应欧洲研究委员会科学理事会要求进行的。 Methodology 术语“AI”在这里通常被定义为“能够观察其环境、学习,并基于获得的知识和经验采取智能行动或提出决策”的机器或代理(Annoni等,2018年,第19页)。这包括各种模型和方法(根据《欧盟人工智能法案》所定义): ·基于逻辑和知识(例如推理和演绎引擎,符号推理和专家系统等); ·统计方法、贝叶斯估计、搜索和优化方法; ·和机器学习(如监督、无监督和强化学习、深度学习等)。 调查还包含了针对生成式AI的具体问题,例如基于训练数据和响应提示可以“根据其训练数据创建新内容,包括文本 、图像、音频和视频”的大型语言模型(如ChatGPT)(Lorenz等人,2023年)。 I页 本报告基于对1,034个ERC受资助者(共计1,046个ERC项目)的调查得出。数量上的差异归因于某些研究者获得多个ERC资助的情况。这些项目正在或计划开发人工智能技术或系统,或者在具体应用中使用人工智能,或者研究其影响和效果,或者包含这些元素的组合。覆盖了所有ERC科学领域(参见2024年ERC委员会结构)——物理科学与工程、生命科学、社会科学与人文科学,以及合作赠款。该调查于2023年10月16日至11月12日由300位ERC受资助者完成(响应率为29%)。值得注意的是,仅当受访者在调查表中明确同意时,报告中才包含带有引用的直接引语(遵循相应的数据保护通知)。 Figure1:Distributionperscientific域图2:主办机构的主要国家 3% 生命科学 18% 德国21 法国 14 西班 牙 7 荷兰9 意大 利 11 协同作用 社会科学与人文科学29% 物理科学与工程50%英国12 瑞士6 值得注意的是,此项目组合并非详尽无遗,不包括所有参与AI开发、应用或研究的ERC项目。关于构建此项目组合所采用方法的详细信息,将在ERCEA即将发布的AIMappingFrontierResearch(MFR)报告中包含,该报告将于此处发布(预计于2024年第一季度发布)。 截至2023年3月31日,从委员会内部CORDA数据库提取了包含14,829个ERC项目的全面列表。该列表涵盖了所有ERC科学领域——生命科学(LS)、物理科学与工程(PE)和社会科学与人文(SH)——包括在FP7、地平线2020和地平线欧洲框架计划下资助的项目,以及所有ERC资助方案(启动、整合、高级、合作和概念验证)。 为了识别与人工智能相关的项目,我们在项目标题、摘要和关键词中进行了关键词搜索,共计产生了约1,453个项目。人工智能的定义主要基于澳大利亚国家科学机构CSIRO(Hajkowicz等人,2022年)的研究以及经合组织报告(OECD,2022年)的参考。 通过ERCEA科学与伦理官员的洞察以及内部分类练习MappingFrontierResearch(MFR)识别了额外项目,该练习包括关于欧盟绿色协议、欧洲适应当代数字化时代和EU4Health等政策事实文件,阐述了欧盟研究委员会(ERC)前沿研究对这些政策的贡献。通过对摘要、报告和成果(CORDIS)的分析,以及拨款协议信息(CORTEX),结合截至2023年9月21日的拨款状态,最终整理出了一份包含1,046个项目的综合清单。 I页 1.AI在科学过程中的当前使用 在最近的一项调查中,全球科学家在研究中广泛使用人工智能的比例从2020年的12%增加到了2021年的16%( Elsevier2022)。文献计量分析显示,在过去十年中,所有领域提及AI或机器学习相关术语的研究论文份额持续增加 ,总比例约为8%(VanNoorden和Perkel2023)。另一项研究表明,在过去五年中,特定研究领域的AI相关出版物平均年增长率达到了26%,超过了之前所有年份17%的平均水平(Hajkowicz等人2023)。另一项文献计量分析指出 ,从2004年至2021年,全球科学研究活动每年增长约5%,而在同一时期,与AI相关的出版物的年增长率一直保持在或超过15%,除了2010年至2012年的几年(Arranz等人2023a)。 在这一背景下进行的ERC调查,强调了AI在科学研究过程中的实际应用,特别是针对已经使用或正在开发AI的ERC资助者 。当被问及他们在科学实践中具体使用AI的情况时,ERC资助者的回答展示了AI在其科研工作中的广泛和多样的应用。许多受访者还提到了基于AI的工具的非领域特定用途(尤其是生成型AI),即作为撰写和编辑文本、语言翻译、编程和编码、为演示文稿生成图像、检索文献等的支持工具。 生命科学 在生命科学(LS)领域(占总受访者的18%),ERC研究人员利用AI方法,例如,理解大规模群体中的个体差异,并对靶向疗法的诊断或结果进行预测。人工智能工具被视为分析基因组、表观基因组和转录组数据集以及比较健康状态与疾病状态和不同疾病状态之间的重要支持。此外,在此领域中,人工智能工具被用于分析大量成像数据并发现复杂模式,或者生成临床应用所需的模拟和模型。在神经科学领域,人工智能对于自动检测神经突触连接或作为人类意识体验的计算模型至关重要。此外,它已成为计算蛋白质组学的必不可少的工具,利用深度神经网络来解读蛋白质序列并预测其性质。 物理科学与工程 在物理科学与工程(PE)领域(50%的总受访者),人工智能的发展或应用范围从计算机科学的基础或核心AI到更多应用研究。它作为数据分析的通用工具对于物理学、化学和生物学的研究至关重要,并推动了模拟技术的发展。跨学科应用包括根据诊断标记分类听力损失模式、进行化学和材料设计的量子力学计算以及模拟人机对话。在天文学中,人工智能和机器学习提高了观测系外行星系统时仪器的控制能力,并用于通过光度法确定大质量恒星的类型。在工程学中,神经网络被用于复杂系统的控制和异常/故障检测,例如电力网络、水分配网络和自动驾驶汽车。人工智能还成为分析、分类和预测物理现象的工具,如天气模式、空气污染、火山变形和地震。 社会科学与人文科学 在社会科学与人文学科(SH)领域(占总受访者的29%),神经网络和自然语言处理(NLP)工具被广泛应用于各种应用,例如手写文本识别和自动语音识别的模型,或对音乐作品的自动分类。大型语言模型(LLMs)用于分析历史文本数据集,从图像分割、文本挖掘,到概念和语言模型。此外,人工智能用于识别语音样本中的应激声学指标,检测在线讨论中的极端言论,识别网上的隐藏广告,或对与金融和金融监管相关的媒体文章进行分类(如丑闻、危机、常规业务等)。人工智能还是一种基于模型的数据分析工具,用于解码和比较大脑中的心理表征,预测或模拟人类的学习和决策过程。 I页 主办机构 在被问及机构支持时,51%的受访者表示其所在机构为在科学实践中使用AI的研究人员提供了支持(其余49%表示未提供支持)。从具体科学领域来看,生命科学(LS)领域的57%和物理工程(PE)领域的52%的受访者提到了这种支持,而仅42%的社会科学(SH)领域的受访者提及了这一点。 支持的主要四种形式包括对跨学科团队的需求(55%)、AI使用培训(50%)、AI伦理指导(46%),以及内部AI工具开发( 41%)。 部分受访者补充说明他们能够获取机构计算资源或高性能集群(例如GPU设施、存储、云计算等),并包括IT人员的专业支持。在其他情况下,他们的组织拥有或参与了人工智能卓越中心,或是建立了专门的研究小组、研究所,并且在全组织范围内提供了支持结构。这些架构提供了教学和培训的资金(也适用于学生和年轻研究人员),并与AI领域的专家建立了联系。还提到了与本地及跨学科专家合作的网络,他们在AI的广泛方面拥有专业知识。 图3:研究人员组织提供的支持类型 55 50 46 41 25 10 19 呼吁跨学科团队 使用AI的培训 人工智能伦理指南 开发内部AI工具 外部AI工具的许可证 我不知道 Other 0%10% 20%30%40%50%60% 2.未来的发展和应用 研究者被要求展望至2030年AI在科学过程中的发展,包括总体趋势和各自领域的具体情况,同时考虑关键应用或进展。大多数受访者认为,AI将作为辅助工具发挥作用,扮演核心或至关重要角色,并在某些情况下加速、颠覆或彻底改变科学过程或其所在领域的一部分。 人工智能将在量化和定性研究之间模糊界限,并使“混合方法”成为常规程序。它不会取代人类进行定性解释,但将提供一种从方法论角度进行反复操作的方式,而这至今仍极为劳动密集型。 EevaLuhtakallio,赫尔辛基大学,芬兰兰) 最常见的应用是数据分析与处理,即AI将加速对大量复杂数据集的分析、量化和可视化。它能够迅速且准确地识别出那些可能无法通过假设驱动研究获取的相关性或模式。在某些领域,AI将用于开发模拟或替代模型, 对于信息不完整的情况,比如用于神经系统详细计算模型的流程,这些模型能够对认知、行为和疾病结果做出精细的预测。 许多受访者指出,人工智能作为编程辅助工具(得益于自然语言处理的发展),将(并且已经在)加速研究中扮演关键支持角色 。此外,通过为试验设置建议参数,人工智能能够帮助更快地设计实验,朝着“由人工智能引导的工作流程,这将显著减少达到目标所需的实验或计算次数”(MatthiasScheffler,德国FHI-马普学会)这一方向发展。 I页 另一个潜在发展是数据