发布人: 生物技术部,新德里-110003七月2021 ©CopyrightDepartmentofBiotechnology TABLEOFCONTENTS 前言认谢缩写 1.Introduction 1.1数据交换和共享的必要性及相关问题 1.2数据交换和共享的必要性 1.3与国际政策协调,确保国家政策取代 2.Definitions 3.数据的来源和类型 3.1公共资源数据 3.2主要数据类型 4.数据存储策略和时间安排 4.1数据存储和定时 4.2元数据的存放 4.3数据存储的豁免 4.4撤回数据 5.数据共享和访问框架 6.数据用户协议 6.1开放访问数据 6.2托管访问数据 6.3数据访问的持续时间 7.审计与法律问题 8.附件一:咨询委员会 9.附件二:部际委员会 .............1 .............1 .............2 .............3 .............4 .............5 .............5 .............6 .............8 ............. 8 ............. 9 ............. 9 ............. 9 ............. 10 ............. 11 ............. 12 .............12 .............13 .............13 .............14 .............16 BIOTECH-PRIDE指南 PREFACE 考虑到政府强调让公民参与治理改革,将非战略数据置于公共领域,以及2005年RTI法案的规定,使公民能够在公共当局的控制下获得信息,从而实现透明度和问责制。每个公共当局的工作,国家数据共享和可访问性政策(NDSAP)已于2012年3月发布。共享所产生的数据不仅对于允许访问其他研究小组也很重要,而且通过允许访问来自全国各地大学和实验室的研究人员和学生的数据来发展强大的研究响应生态系统。目前,产生的生物数据存放在国际资料库中;此外,没有规定这一点的准则。如果共享,数据和知识的价值将得到多倍增强。在全球范围内,所有主要资助机构和政府都有明确的数据共享政策/指南,用于生物数据存储和共享。 印度的生物技术-PRIDE(生物技术-通过数据交换促进研究和创新)指南旨在促进和促进生物知识的共享和交流,通过在该国进行的研究产生的信息和数据,特别适用于高通量,高容量的数据,例如由下一代测序仪,微阵列和质谱等仪器产生的核酸和蛋白质序列;通过X射线晶体学,核磁共振(NMR),CryoEM等确定的生物分子结构。全身图像(如CT扫描,PET扫描,X射线和MRI图像),器官和细胞;和流式细胞术数据。这些准则不允许共享文档中定义的“敏感数据”。 这些指南本身不涉及生物数据的生成。这些准则创建了一种促进机制,以共享和交换由数据生产者/生成器/提交者根据印度政府(GoI)现有的相关法律,规则,法规和准则制作/生成/提交的信息和知识。这些指南已与GoI的相关现有规范保持一致。 由于获取数据的技术平台以及数据的性质正在迅速变化,其他机构的相关政策正在考虑由印度政府批准,预计该准则文件将定期审查并酌情修改。 BIOTECH-PRIDE指南 确认 一项研究产生的数据可用于探索其他研究问题,从而可能导致扩大数据的科学价值。有鉴于此,并根据《2012年国家减贫战略》的原则,通过广泛的利益攸关方和部际协商,制定了生物技术- PRIDE准则,以实现生物数据的共享、获取和存储。 在目前的情况下,正在生成的生物数据存放在国际资料库中,没有现有的准则规定了这一点。因此,制定通过数据交换促进研究和创新的生物技术指南(Biotech-PRIDE)一直是一项艰巨的任务。该部开始采取步骤,制定关于分享和交流生物学知识、信息和数据的文件。由博士组成的“工作组”编写了“零草案”ParthaMajmder,NIBMG,Kalyai,博士AloBhattacharya,阿育王大学,Soipat博士BiayPada,JNU,新德里,博士RameshSoti,CCMB,HyderabadadDr.YogeshShoche,NCCS,浦那。我们非常感谢工作组在起草这份文件方面迈出了第一步。由博士担任主席的咨询委员会G.Padmaaba,IISC. ,班加罗尔审议并讨论了工作组编写的草案,并修改为“初稿”。我们感谢咨询委员会主席和成员在文件编写过程中提出的友好建议和努力。 该草案已公开发布,以征求各利益相关者的意见。有关政府机构的意见-DST;DSIR&CSIR;DARE&ICAR;DHR&ICMR;MoHFW;NBA;MoEFCC;MoES;还征求了Meity,MoH,PSA办公室和NITIAayog。我们真诚地感谢每位受访者的建设性批评和建议,这有助于我们进一步制定文件。 由DBT秘书RenuSwarup博士主持的部际委员会对草案进行了修改,并注意到了公众咨询以及有关政府机构和所有其他利益相关者的意见。我们非常感谢部际委员会主席和成员最终确定了该文件,该文件现已作为《生物技术PRIDE准则》颁布。 最后但并非最不重要的一点是,DBT团队的不懈努力和热情将被高度赞赏地记录在案。博士的努力ShahajUddiAhmed,科学家“E”,博士A.VamsiKrisha,科学家'E'和博士OarNathTiwari,科学家'E'在编写本文件时受到赞扬。博士的努力和热情科学家“C”RichiVMahaja也受到赞赏。我们进一步赞扬先生的支持AitAgrawal和PrachiGrover女士负责文件的设计。DBT支持人员的辛勤工作也得到了认可。 我们向直接或间接为本文件作出贡献的每个人表示诚挚的谢意。 SuchitaNinawe博士 DBT顾问 BIOTECH-PRIDE指南 BCF 缩写 BAM 二进制对齐映射 位清除文件 BED 浏览器可扩展数据 CEL CIMFast事件语言文件 CRAM 质询响应认证机制 DBT 生物技术系 DHR 卫生研究部 DNA 脱氧核糖核酸 dta 国防技术安全管理局 EXP 保护模式可执行程序 GA4GH 全球基因组学与健康联盟 GBS 通过测序进行基因分型 GFF 常规特征格式 GoI 印度政府 IBDC 印度生物数据中心 ICMR 印度医学研究理事会 MIMAG 宏基因组组装基因组的最低信息 MIMARKS 关于MARKer基因序列的最少信息 MISAG 猎枪组装基因组的最低信息 NBA 国家认证委员会 NDSAP 国家数据共享和可访问性政策 PCR-RFLP 聚合酶链反应-限制性片段长度多态性 PRIDE 通过数据交换促进研究和创新 系统全球区域 RNASGA Ribo-Nucleic酸 TPM 可信平台模块 TXT 文本 VCF 可视组件框架 BIOTECH-PRIDE指南 INTRODUCTION 1.1数据交换和共享的必要性及相关问题 2012年颁布的印度国家数据共享和可访问性政策(NDSAP)鼓励数据共享。印度政府投入了大量公共资金,在各个部门产生数据,包括生物科学方面的数据,以产生知识,从而深入了解复杂的生物机制和其他过程以及进行翻译。除非在数据生成后的合理时间内与其他研究小组交换和共享数据 ,否则知识生成数据的效用将受到限制。结果,公共投资对知识生成的收益累积将受到损害。因此 ,数据共享和交换的必要性是,从产生知识和数据的公共投资中获得最大利益。在印度,没有关于存储访问和共享生物数据的具体准则。《生物技术PRIDE指南》将促进这一点,并促进信息交流,以促进全国不同研究小组的研究和创新。《生物技术PRIDE指南》适用于通过国内研究产生的所有生物数据。主要数据类型在本文档的第3节中给出。 如果有一个国家数据存储库(中心),将所有生物数据存储在其与各种其他中心/数据集(辐条)相连的服务器中,数据的最大收益是可能的。国家资料库将充当促进者,负责获取和共享生物知识,信息和数据。该文件为交流和共享所有生物资源产生的数据提供了框架和原则,同时保护了个人和人口的权利,而不会对其造成任何伤害。它还确保因共享获取该国生物多样性而产生的数据而产生的利益共享。数据提供者/生成器/提交者和用户应受GoI现有相关法律、法规、规章和指南的约束。 BIOTECH-PRIDE指南1 1.2数据交换和共享的必要性 该资源主要有四个利益相关者-帮助生成资源的资助者,生产者,其样本用于数据生成的个人以及资源的用户。所有四个利益相关者都必须承担如何交换和共享数据的责任。共享公共资源数据时必须考虑许多问题。 数据共享必须以负责任的方式进行。共享数据的方式必须保护隐私、机密性和安全性,并且应当是非歧视性和公平的,并且不得由于人类数据共享而对个人造成伤害。它还应遵守GoI接受的有关保护生物多样性权利和惠益分享的相关国家和国际协议。指南不允许共享“敏感数据”。 对于使用“人类”和“非人类”样本的数据生成,数据生成器/提供者/提交者必须遵循GoI现有的相关法律、规则、规章和指南。 负责任的数据共享意味着要遵循某些原则。这些包括: 数据质量、存储和安全性: 数据的质量必须是高标准、无偏见和可验证的。对于非人类数据,其必须伴随有如上所述的最低基本元数据。在定位种群(例如重组自交系,F2系和其他)的情况下,种群的元数据必须与表型数据一起可用。对于全基因组关联研究(GWAS),所研究人群的表型数据也必须与其元数据一起提供 。数据提交人负责按照国家存储库规定和定期更新的数据收集标准,确保提交数据的高质量和真实性。存储必须以保护隐私和机密性的方式进行,并促进易于访问、搜索和长期维护。必须在存储和访问框架中嵌入适当的安全功能,以避免破坏数据信任。可以内置能够跟踪数据访问链的特征。存储和安全指南还必须解决数据存储和可访问性的持续时间。必须建立从资源用户获得反馈的机制,以提高数据质量,数据访问,数据完整性和互操作性。 BIOTECH-PRIDE指南2 保护隐私和机密性: 从人类生成的共享数据不得包括任何个人标识符,并且必须在知情同意的情况下收集,包括在充分 匿名/去识别后同意共享数据。除非并且直到有任何法律命令这样做,否则不得尝试在匿名化/去识别之后进行重新识别。此外,必须注意确保数据资源不被用于歧视族裔、宗教、地理或任何其他社区。在使用人类样品生成数据之前,数据提交者需要获得适当的伦理批准。 准则的透明度: 数据共享准则必须是透明的,并且必须以公开可访问的方式说明与公共和私人组织在国家边界内和 跨境进行数据传输的准则,以用于知识和商业用途。 公众参与和投诉: 公民应参与制定数据共享政策和方式。这种参与应导致未来准则的改进。还应该有一个正式的机制 来登记对数据滥用的投诉并处理此类投诉。 1.3与国际政策协调,确保国家政策取代 已经举行了许多国际磋商,以建立和发展共享生物信息和数据的规范,规则和条例。其中包括1996 年《百慕大协定》、2003年《劳德代尔堡协定》、2010年《名古屋获取和惠益分享议定书》、 2013年《全球基因组学与健康联盟指南》和2016年《欧盟通用数据保护条例》。本关于生物技术资源信息和数据共享的现有框架尊重并坚持国际话语和协议的原则和宗旨,强调数据应在世代后迅速发布和共享的原则。该框架也与现有的国际协定保持一致,但是,在国家和国际政策不一致的情况下,国家政策和准则将被取代。 BIOTECH-PRIDE指南3 定义 “访问”意味着用户从存储库中检索信息/数据用于研究/患者护理/商业目的。“匿名化”是指加密或删除所有可以从数据中识别个人的信息的过程。 “生物数据”是指与生物体有关的所有信息,包括其核酸,蛋白质序列,代谢物以及其他分子和功能特征。 “同意”是指在充分了解和理解以任何书面/电子/视频形式