问题简报 保持最新的新兴技术趋势 利用大数据通知规划 作者EmeliaS.ProbascoChristianSchoeberl 2024年12月 目录 介绍................................................................................................................................... ............2背景.................................................................................................................... ...........................3之前的研究.......................................................................................... ............................................3CSET合并语料库、研究集群和科学ETO地图.................... .........................................................................3集群特征和元数据................................. .......................................................................................4方法论.................................... ........................................................................................................5第一步.找到与组织 相关✁论文.6步骤2和3.分析 集群.8寻找感 兴趣的候选集群................................................................................................................ 8增长................................................................................................................................ ...............9出口想法的集群............................................................................................... .......................9第四步.选择并展示一部分集群供人类审查............................................ .................................11展示集群并传达数据限制........................................................... .................................................12第五步.涉及领域专家................................................ ....................................................................24概念验证讨论结果................................... .....................................................................................25SME研讨会参与者观察和收获 ....................................................................................................26结论和此方法的未来 应用...........................................................................................................28作者.......... .......................................................................................................................................... 31致谢.............................................................................................................................. .........................31附录A:使用集群内论文的特征来识别相关集群.................................. .................................................32集中度指标局限性...................................................... ..........................................................32核心或高被引论文............................................ ........................................................................34语料库论文出口.................................. ......................................................................................34附录B:确定百分位数............ .......................................................................................................35附录C:CSET的人 工智能分类器.36使用人 工智能分类器.................................................................................................................... 36附录D:讨论指南.......................................................................................................... ..................37附注........................................................................................................... ......................................38 Introduction 决策者今天面临着紧跟新一轮科学和技术研究成果的巨大压力。许多人希望大数据和人工智能(AI)能够实时识别研究中的演变和革命,甚至在它们发生之前就能预测。如我们在下文中将讨论的那样,数据本身无法预测科学革命。然而,通过分析数据来保持对新技术的了解或略领先于新技术,仍然是有价值的。 本文提出了一种人机协作的方法,以系统地识别组织的研究发展。首先,我们的方法从识别组织自身发表的文章开始。其次,我们利用这些文章在中心安全与新兴技术(CSET)科学地图中找到研究集群,该地图根据引用模式将全球学术文献聚类展示。第三,我们基于我们认为能够指示重要研究活动的元数据选择一部分集群。第四,我们将选定的集群分享给相关领域专家(SMEs),并促进关于研究及其对组织潜在影响的讨论。 我们将在后续部分详细描述每一步,并通过一个概念验证实验来评估我们的方法。 本论文旨在为组织内进行研究或投资组合及优先事项开发的个人提供参考。它也应有助于中小企业探索或了解因专业化程度不断提高而可能无法接触到的研究领域。 背景 先前的研究 技术预测和视野扫描旨在识别趋势并预测技术进步。许多组织开展视野扫描或预测项目以塑造其发展和投资组合。一些组织通过组建团队与顶尖研究人员建立联系并参加会议来感知新兴趋势,而另一些则雇佣分析团队提供定量输入以做出决策。这些努力涉及从政府到军事机构,再到医学研究所,以及智能家居供应商等多个领域,以及其他许多组织。1 方法预测和horizon扫描可以包括定量和定性方法,单独使用或结合使用。2例如,一种值得注意的定性方法是德尔菲法(Delphimethod),其目的是基于多次调查和群体讨论,让专家们就可能的未来情景达成共识。3相比之下,定量方法可能依赖于趋势分析和对研究论文、专利申请、公司备案以及风险投资基金的数据进行建模,单独使用或综合运用。4过去的技术预测努力的分析表明,将定量分析与人类判断相结合的方法通常 更为成功。5 越来越多地利用新的数据分析技术,包括自然语言处理(NLP)和大型语言模型,来推动定量方法的发展。6此外,轻松处理大量数据的能力促使政策制定者和研究人员渴望 获得他们可以轻松操控的工具,以探讨特定的新兴技术问题或需求。7有许多可用的数据库可以用于此目的:文献计量数据库如Scopus、SciVal或WebofScience;专利工具如Clarivate或Quid;以及融资工具如PitchBook和Crunchbase。CSET自身的新兴技术观测站(ETO)平台同样提供了可用于探索研究、专利和融资信息的公开工具。* CSET的合并语料库,研究集群和ETO科学地图 在本文中,我们以CSET的数据科学资源为基础构建了提议方法论的定量部分 ,尽管其中也包含了一些其他元素。 *CSET的ETO向公众开放https://eto.tech/. 上述工具可以在类似的过程中使用。8在CSET的数据资源中包含合并的学术文献语料库,这是一个包含来自世界各地超过25900万篇科学出版物的数据集。该语料库结合并去重了Clarivate的WebofScience、OpenAlex、Lens、SemanticScholar、arXiv和PapersWithCode等来源的出版物,并包含了关于每篇出版物的元数据信息,包括作者affiliation、资助机构以及引用次数。合并后的语料库构成了CSET的科学地图(ETOMapofScience)的基础,这是一种基于引文模式组织全球学术文献的可视化展示。9合并语料库中频繁相互引用的研究论文可以被分组为CSET所称的研究集群。这些集群通常会在论文共享同一研究主题时出现,尽管它们也可能因为其他原因通过引用而连接在一起。论文之间引用链接越多,它们被分在同一集群中的可能性就越大