华东政法大学教授/ 高富平 目录 01 数据要素化与资产化 02 与数据特征适配的数据产权:以持有权开启数据要素市场 03 数据资产界定、估值和管理:以数据使用(权) 为核心 01 数据要素化与数据资产化 •以大数据+人工智能为代表的第二代数字技术带来人类认知革命•数据挖掘、机器学习、AI成为新的知识生产方式,成为区别于人类智能体系——机器智能(AI)。 通过迭代的自我训练过程,机器发现数据集中的假设模式,然后应用这种学习来检测新数据集中的模式。 机器学习改变了模式识别(人类智能的基本工具)的规模和能力(有效识别、分类、存储和使用信息的能力),可以发现人不能发现的模式。 数据本身并没有多少价值,数据的价值在于认知价值,只有正确认知,转化为智慧决策或行动,才转化为生产力 计算机技术的不断发展使数据演变为知识/智能的生产要素: •通过数据关联分析可以洞察数据代表的客观世界的规律——发现新知,洞见未来。•数据的价值由过去的人认知手段,演变为机器分析或学习的原料:新一代数字技术和架构的本质在于通过高速(Velocity)的采集、发现和分析,从超大容量(Volume)的多样(Variety)的数据中经济地提取价值(value),即知识•机器学习产出智能和知识产业化,需要解决机器学习的原料的供给——尤其高质量的数据,以满足新知识生产财富是知识,增长是学习,金钱是时间,信息是新发现(surprise) ——George Gilder, Life After Capitalism 数据成为生产要素:加速AI应用,促进知识生产——数据到生产力的转化 数据要素化/数据产品化: 大多数情形下,数据是副产品,即使专门采集的也需要治理原始数据资源治理成为可用数据、可重用数据,形成可重用数据集(数据要素)可重用数据集的集成产出最终数据产品:智能产品/知识(数据产品) 数据资产:可控制+可变现的数据资源 基于数据的智能决策/智慧行动(间接变现) 可流通数据:可重用数据集(数据流通)可交易数据产品:智能成果(成果许可+数据/智能服务交易) 数据可用:可用于计算分析 原始数据:反映客观事实的数据可机读:适合的格式和形式符合一定质量:真实、完整、一致等合规性:不侵权、不违法 可用数据:企业无形资产 可用数据的使用:智能决策系统(提升绩效和竞争力)甚或产出物许可使用 可用数据的形成:数据治理/data curation 将不可用数字记录转化为可用数据数据利用治理是一种生产活动——改变和增加数据的价值,使数据成为可用、好用的经济资源(知识/智能原材料) 数据治理产品化思维:以用户为核心的数据治理 数据脱离原生场景被使用,即可流通利用(提供数据供接受者使用)数据可重用,数据成为可交易商品(数据作为产品和数据产品)可交易数据:作为企业无形资产(直接变现和间接变现) 数据可重用/可交易的条件 技术条件:数据可识读(语义元数据)+数据可互操作(格式和系统)制度条件:数据持有者有权(流通权)+数据流通安全可控(供方有限责任) 数据分析:使用数据生产出产品(知识) 定性数据分析、验证性数据分析(证实)、探索性数据分析(发现)data mining,data profilingMachine Learning 数据最终产品:知识形态的数据 模型数据分析报告(描述、诊断、预测、方案等分析报告) 数据产品化是一个过程,为构建数据交易市场,可区分出两类数据资产 数据产品Data Product 数据要素Data as a Product • 数据的使用价值在于相关性分析计算的价值。• 数据本身没有固定的价值和形式,只是将处理后的数据视为促进其流通的产品• 是生产数据产品的原材料,价值体现于相关性、聚合性和可编辑性上• 基本形式:数据集 • 数据产出物,如算法模型、智能工具、知识结论、分析和预测等知识产品。• 数据产品本身不再是数据,而是知识或智能,可以称之为智能产品。• 数据产品作为数据输出,赋予社会消费品权力,通过数据消费转化为生产力。 02 与数据特征适配的数据产权:以持有权开启数据要素市场 •知识内容也不存在所有权(IP不是知识专有权) •事实数据为什么没有所有者? •独创性内容表达(作品)享有版权(控制表达)•非独创性内容(数据集合)没有版权,只有合法利益受保护•专利技术:公开内容,换取特定期限专有权 •事实数据是认知媒介,数据来源应当开放(保护来源者合法利益); •数据有所有者就会妨碍人们对客观世界的认知,妨碍科学研究和探索 •数据排他支配权/所有权不具有操作性,无限增加社会交易成本,影响数据社会价值实现 “产权”:构建资源利用秩序的制度工具数据产权目标:结束无序使用,构建数据重用秩序 数据持有者:收集和汇集数据,转化为可用好用数据产品的加工使用者(要素化者)基于价值创造对加工使用形成的数据或数据产品享有持有者权。激励价值创造,实现经济价值,但是该权利很难清晰界定,也不能基于先占或劳动而享有支配权,更不能绝对化、长久化。 数据来源者:消极防范滥用侵害权益;获益权来源者是数据所映射的客观物理对象,包括人、物(物主)和组织——被认知或分析的对象配置以数据决定权会妨碍人类探索认知客观规律,发现新知的自由 使用者:每个社会主体获取和使用数据的权利数据是认识客观世界发行客观世界的媒介,数据使用创造生产力,改进社会福祉保护每个社会主体获取使用数据的权利是数据基础制度根本目的 合法控制数据持有者享有什么权利——实现数据价值 •确使用,不确归属 •数据权利配置本质:数据上合法利益保护 •数据使用的正当性: •数据持有者配置权利基础: •每个人法律上有权获取和使用数据 •非基于先占/控制(控制不能产生支配权) •合法获取者可使用 •基于生产/加工使用(价值创造),但不限于价值创造(合法利益) •创造价值者的持有者可流通 数据持有者权:非排他使用权 数据持有权:权利与义务为一体 •数据上并存在各种利益(持有不消灭合法利益): •数据持有权:非基于主体与客体归属/支配/控制关系的识别(非单一可识别权利)•数据持有者行使权利条件:•事实控制+合法性证明(判断)•合法性:安全、合规、不侵权 (1)来源者利益:•个人(安全、隐私和个人信息权益)•企业(商业秘密和数据持有权) (2)国家安全利益(3)公共利益/社会利益 03 数据资产界定、估值和管理:以数据使用(权) 为核心 人类借助数据认知客观世界,获取有价值的信息 数据价值来源于应用 数据因使用而产生价值认知/知识智慧行动决策价值 基本指导思想:为使用者配权,基于使用行为来估价通过界定和规范使用行为构建数据流通利用秩序 《数据二十条》“为激活数据要素价值创造和价值实现提供基础性制度保障” •数据使用者: •“数据加工使用权”旨在对加工使用行为进行保护 •获取、控制、加工处理数据者•计算分析和获取计算分析结果者•排除非消费性使用(不产出新数据或知识) •加工使用:创造价值的生产性使用 •治理:可重用数据集 •使用者赋权理由:数据不存在基于先占和劳动的排他,数据源开放和数据开放可获取,惟创造价值加工者享有使用权 •保护方式:数据产品持有权(流通权)•在即采即用情形下,数据根本不需要赋权 数据使用 数据流通 •数据流通的内容为数据使用权实现 •数据流通“标的”:“特定数据+特定使用”•数据使用秩序(权利责任利界定)基础•定价基础;•流通控制(过程审计)•风险控制基础(访问+使用控制) •特指可重用数据集提供/许可他人使用/data sharing(不放弃持有前提下的多重、非排他、多主体使用安排)•让渡数据使用,而不是权利:证明来源合法性,基于加工使用取得加工数据使用权•数据流通不等于数据交易,凡是安全可控实现数据使用均为流通:交换、共享、交易、受控开放•流通即使用,使用即流通,数据流通实现数据的社会配置和利用,实现数据社会价值 •可行的数据流通 •收益(特定使用预期产生的经济价值)≥成本(治理成本+流通成本)•收益可预测——商业规则;•收益不可预测——数据交换或共享——各自获取使用利益 数据资源的非排他性、可分享性、非消耗性,“存货”只是数据无形资产变现的方式