您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[浙江垦丁律师事务所数据资产部]:2024年构建数据资产-训练数据合规处理及数据资产入表处理研究报告 - 发现报告

2024年构建数据资产-训练数据合规处理及数据资产入表处理研究报告

AI智能总结
查看更多
2024年构建数据资产-训练数据合规处理及数据资产入表处理研究报告

目录 撰写人简介1报告起草情况与起草人简介2免责声明4序言5第一部分61.政策背景与市场分析7 1.1训练数据合规的政策背景7 1.2数据资产入表的政策背景8 1.3训练数据市场分析10 1.4数据资产入表的市场情况11第二部分142.训练数据的合规应用15 2.1训练数据的主要应用市场15 2.2训练数据的提供者合规16 2.3训练数据的使用者合规18第三部分21数据资产入表操作处理213.数据资产入表操作处理22 3.1入表的总体规划22 3.1.1入表的主体选择22 3.1.2会计准则的适用23 3.1.3入表与税务规划253.1.4数据资产预期经济收益的预测26 3.2数据资产入表标准化处理283.2.1数据资产入表的标准化流程28 3.2.2数据的确权与达到控制的具体判定条件30 3.2.3数据资产的全生命周期合规治理32 3.3不同类型企业数据资产入表时的重点关注33 3.3.1平台型企业数据资产入表时的重点关注33 3.3.2大型传统企业数据资产入表的重点关注34 3.3.3中小企业数据资产入表的重点关注35 3.4数据资产入表还应注意的其他问题36 3.4.1上市公司关于数据资产评估的披露36 3.4.2数据资源的反舞弊建设36致谢38 撰写人简介 垦丁律师事务所是由一群在网络法实务领域有丰富经验的律师,于2017 年7月共同创设,是一家完全专注于提供“网络法”法律服务的专业律师机构。垦丁律师正在服务或曾经服务的客户包括:腾讯、小米、蚂蚁国际、天猫人工智能、百度、360、星际魅族、虎牙、唯品会、焦点科技等综合和细分市场头部互联网企业。也包括强生、耐克、松下、smart、上汽大众、OPPO、日立(中国)、传音控股、鹏成新能源等智能制造和新兴产品市场。 垦丁所的业务范围涉及平台治理、产品合规、投资并购、数据合规、知识产权、跨境争议解决等等,行业领域涉及综合网络平台、AIGC、NFT/区块链、数字娱乐、智能终端等。 中联资产评估集团(浙江)有限公司【简称:浙江中联】成立于2004年1月,具有企业整体评估、单项资产评估(包括房地产、机器设备、流动资产、无形资产、数据资产评估)和资产评估咨询等业务资质。 目前浙江中联拥有执业人员90余人,注册资产评估师50余人。执业人员具备较强的资产评估能力,技术理论基础扎实,工作经验丰富,从事过各种类型的资产评估工作。 浙江中联是首批通过财政部、证监会证券资格备案,连续八年入围中国资产评估协会机构综合排名前百强,浙江省资产评估机构综合评价排名前二。 报告起草情况与起草人简介 报告的训练数据合规的相关内容由垦丁律所程念律师起草,数据资产入表操作处理的相关内容由垦丁律所徐艺凌律师起草,数据资产评估内容由浙江中联刘赛莉老师起草。 起草人简介(按姓名首字母拼音排序) 程念律师 中国政法大学法学硕士(网络法学专业),垦丁律所人工智能法律研究部负责人,专注于人工智能、游戏合规、直播短视频法律服务、电商合规、平台治理、数据合规、个人信息保护、元宇宙相关法律服务及知识产权、不正当竞争、服务合同相关的涉网诉讼等互联网法律实务工作,为多家知名网络公司提供常年法律顾问服务,包括平台协议起草与调整、电商平台价格与广告合规法律方案、资质准入、平台协议审核、广告合规咨询、新业务风险评估等合规咨询服务等; 参与首例5G云游戏第一案、小米手机风险APP治理第一案等典型案件,代理游戏道具低价代充不正当竞争纠纷、直播带货预期可得收益追回案等; 参与撰写《直播与短视频产业合规蓝皮书》《元宇宙与元规则——元宇宙产业及元规则体系建构蓝皮书》等报告; 参与编写著作《<中华人民共和国数据安全法>理解与实施》。 刘赛莉老师 中联资产评估集团(浙江)有限公司合伙人、技术总监。注册资产评估师、注册房地产估价师。自从事评估工作以来,共参与鞍钢集团等将近100多个项目的评估工作,专业技术底子较厚。适合参与评估重点问题、疑难问题的研究,特别是上市公司和国资央企的评估。 入选行业技术专家库、高端人才或领军人才情况: 1 2019年5月至今浙江省资产评估协会首批资产评估行业执业质量检查暨技术帮扶人员; 2 3 浙江省注册会计师协会第一届数字化改革委员会委员;浙江省资产评估行业第一批后备管理人才; 4 5 浙江省注册会计师协会资产评估行业执业会员后续教育优秀培训讲师;浙江万里学院客座教授; 6 7 8 杭州市财政局质量检查人员;浙江省财政厅质量检查人员;浙江省国资委专家。 徐艺凌律师 同济大学法律硕士,垦丁所数据资产部负责人,中国注册会计师协会会员(非执业)、数据安全师(中级),通过证券从业资格、期货从业资格、期货投资分析考试。 执业领域:科技公司的信息披露与合规化治理、数据资产类财法实务及其他相关网络法领域。 参与起草团体标准《可入表数据资源信贷融资基础要求》 财务领域丰富实战经验:曾就职于内资八大会计师事务所IT与金融事业部、top30地产集团,从事过科技型上市公司(A股)年度报告的财务审计、IPO、境内债发行及公司金融管理等工作。 社会职务:长三角大学生就业创业联盟副秘书长,致力于大学生创业就业的财法合规公益宣讲。 免责声明 本报告仅代表作者个人观点,仅为提供一般性信息之目的,不应用于替代专业咨询意见。尽管本报告中所包含的信息都是我们于发布之时从我们认为可靠的渠道获得,但鉴于数据相关的法律法规变化迅速,司法实践也会依个案实际情况处理,因此不对本报告内容、观点以及建议的准确性、可靠性、时效性以及完整性作任何明确或隐含的保证。 本报告仅供企业参考使用,企业切勿依赖,任何仅依照本文全部或者部分内容而做出的决定以及因此造成的后果由行为人自行负责,本文的机构和作者明示不予承担任何责任。在相关法律法规进行变更或更新时亦不会另行通知。 序言 随着人工智能技术的飞速进步,特别是应用型人工智能领域的迅猛发展,智能化已成为各产业转型升级的重要方向。在“AIallin”的环境下,训练数据的合规性问题已经成为业界与学术界共同关注的焦点话题。近年来,国内外首例涉及人工智能的法律案件相继出现——从我国的“AI文生图第一案”到美国ROSS案(首例AI训练数据版权第一案),这些标志性案例不仅揭示了训练数据合规治理的紧迫性和复杂性,也表明相关法律规则亟需进一步完善。 2024年标志着数据资产入表元年的开启,国有企业、央企以及地方城投公司正积极投身于这一新的发展阶段;与此同时,上市企业与互联网公司也在积极探索与落地部分数据资产入表案例。数据资产入表的核心在于明确数据的所有权并进行合理的价值评估,确保数据的安全性与推进数据标准化建设同样至关重要。 “数据二十条”作为指导性的政策文件,虽然为数据确权提供了框架性指引,但具体的法律规定仍有待进一步明确。此外,在数据资产评估实践中,传统评估方法需要与时俱进,适应数据时代的特性与需求。 鉴于此背景,本报告旨在通过梳理政策环境、分析市场趋势、分享数据资产评估的实际案例以及探讨数据资产入表的操作实践,沉淀和总结宝贵的经验与知识。我们期望这份报告能够为促进训练数据的合规治理和数据资产化的标准化处理提供有益的参考和支持,助力这两个关键领域实现健康且可持续的发展。 第一部分政策背景与市场分析 1.1训练数据合规的政策背景 1.2数据资产入表的政策背景 1.3训练数据市场分析 1.4数据资产入表的市场情况 1.政策背景与市场分析 1.1训练数据合规的政策背景 2023年,一款能够基于在预训练阶段所见的模式和统计规律生成回答的产品ChatGPT把人工智能的热潮彻底掀开。与这一波市场浪潮一并而来的,是产品接连被爆出训练数据违反合理使用,训练过程侵害个人数据权益等负面新闻。一系列关于训练数据的负面消息不得不让世界各国开始关注训练数据的合规问题。然而,训练数据并不是法律意义上的数据分类类型,其本质是所有投喂模型训练的数据集合,包括公开数据、基于自身业务获得的数据等,其中也包括他人享有知识产权的数据以及个人信息。训练数据合规问题是数据内部治理的综合体现,除了近期出台的与训练数据强相关的《网络数据安全管理条例》《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》,以往关于数据收集、存储、使用、加工等数据处理行为的法律法规也是指导训练数据合规的重要规范。 本报告整理了不同类型数据的使用规范以及相关政策文件,就训练数据合规政策背景进行以下梳理: 一、不同类型数据收集、存储、使用、加工行为的依据已经建立,训练数据收集获取首先要符合这些法律规范的要求。《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》等基础性法律文件为训练数据的安全管理和个人信息保护提供了法律框架,明确了数据处理活动最基本的责任与义务。《科技伦理审查办法(试行)》中规定,利用个人信息数据的科技活动,应当进行科技伦理审查。这明确了相关的研究性活动属于科技伦理范畴。 二、《网络数据安全管理条例》《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》针对“训练数据”进行专条规范,展现了当前训练数据合规的重点内容和政策导向。《网络数据安全管理条例》要求加强对训练数据和训练数据处理活动的安全管理,采取有效措施防范和处置网络数据安全风险;《互联网信息服务深度合成管理规定》也提到了训练数据管理和数据安全 问题,并要求训练数据包含个人信息的,应当遵守个人信息保护的有关规定;《生成式人工智能服务管理暂行办法》要求依法开展预训练、优化训练等训练数据处理活动,采取有效措施提高训练数据质量并提出推动生成式人工智能基础设施和公共训练数据资源平台建设,扩展高质量的公共训练数据资源。 由此可知,国家对待训练数据的态度是要在保障数据安全和个人信息安全的基础上实现训练数据的高质量发展和“资源化”发展。 三、我国正在积极制定多项包含训练数据合规内容的国家标准,作为接下来指导企业具体合规工作的重要参考文件。全国网络安全标准化技术委员会发布了 《网络安全技术生成式人工智能服务安全基本要求(征求意见稿)》,全国信息安全标准化技术委员会发布《信息安全技术生成式人工智能预训练和优化训练数据安全规范(征求意见稿)》。其中,《网络安全技术生成式人工智能服务安全基本要求(征求意见稿)》涵盖了训练数据安全的具体要求、风险点及安全措施要求,《信息安全技术生成式人工智能预训练和优化训练数据安全规范 (征求意见稿)》则包含了训练数据处理活动的评价方法,并对违反核心价值观、歧视性内容、商业违法和侵权等具体风险点进行示例说明。 对于需要数据投喂进行学习的人工智能产品而言,训练数据是产品开发中必不可少的要素,相关企业对于训练数据的需求是不言而喻的,如果将已经完成的训练数据作为数据资产投入交易,则可以构建更广阔的数据交易市场,也能一定程度减少企业合规成本。就数据资产而言,从2021年《国务院关于印发“十四五”数字经济发展规划的通知》开始,国家大力倡导协同推进技术、模式、业态和制度创新,切实用好数据要素,将为经济社会数字化发展带来强劲动力。各地纷纷设立数据交易所尝试探索数据交易新模式。截至2024年5月,31个省(区、 市)和新疆兵团均完成机构组建,其中,独立设置机构26个,加挂牌子的6个 1。将训练数据打造成可交易的数据资产既有政策优势,又有现实需求,必将成 为数据市场的一大趋势。 1.2数据资产入表的政策背景 随着《企业数据资源相关会计处理暂行规定》于2024年1月1日的正式实 1《数据交易场所发展指数研究报告(2024年)》 施,2024年被誉为数据资产入表的元年。这一年,一系列重要政策文件和指导意见出台为释放数据要素的资产价值,推进数据资产化提供了坚实的制度基础和技术支持。特别从三季度末开始,国家层面连续发布了多项旨在推动标准化体系建设、公共数据资源开发利用、数据资产高质量管理与数据产业高质量发展的重要文件,这些举措不仅反映了