随着数据量的增长,数据特征高维、模态格式多样的趋势逐渐明显,对数据的AI建模也相应地更加复杂,涉及到研究对象的多变量维度,如时间、空间维度,计算复杂度会随之呈指数增加,数据标注难度也会增加。同时,海量的数据将不可避免带来更大的数据噪声问题、数据偏见风险,为模型如何有效利用好数据、学习其中的知识带来更大挑战。数据是产业智能化发展中最宝贵的资源。