加快建设自主可控的科学数据体系
科学数据在数据与智能驱动的科研范式变革加速演进中愈发凸显出基础性和战略性,对我国实现高水平科技自立自强、增强国际竞争话语权和发展新质生产力具有重要意义。当前,我国科学数据体系建设仍存在管理碎片化等诸多问题,亟待统筹谋划,建立完善的科学数据管理体系,对政策、标准、技术、平台、服务、应用进行全链条统筹整合。
科学数据体系建设意义重大
科学数据又称为研究数据或者科研数据,是由研究人员在科技创新活动中创建和收集的证据,并在应用和传播过程中实现增值。从科学数据属性上来看,科学数据与个人数据、公共数据、产业(行业)数据、企业数据、政务数据等其他类型的数据相比,既有独特性,也存在交叉性。特别是随着科研范式变革以及科技创新和产业创新的深度融合,科学数据与产业(行业)数据的边界日益模糊,科学数据与个人行为数据的关系日益紧密,科学数据本身亦有公共数据属性,但又是具有科研特性的公共数据。当前加快科学数据体系建设、构建科学数据的全生命周期治理框架具有极为重要的意义。
第一,助力人工智能赋能科学研究,重塑科学发现范式。当前人工智能与跨学科研究需要高质量、高价值密度数据,要求打破数据边界,促进流动互通。科学数据体系为人工智能大模型提供了系统化、标准化、可访问的训练“燃料”,是驱动人工智能在材料设计、药物筛选等科学研究中发挥作用的基础,从而加速新规律发现和重大科学问题突破。
第二,捍卫大国博弈中数据主权,保障国家安全。科学数据成为战略资源,建设自主可控的科学数据体系,确保关键领域科学数据获取、存储、处理的自主可控,可以提供重要的替代支撑,对国家安全至关重要。
第三,支撑我国科技强国建设,实现高水平科技自立自强。通过科学数据公共平台建设,可以使有限的科研经费更集中于原创性研究和关键技术攻关,整体提升国家科技投入产出效率。高质量的科学数据体系还能吸引全球顶尖科技人才,加速科技成果转化,为培育新质生产力提供强大的数据驱动力。
我国科学数据体系建设存在的问题
虽然我国科学数据治理能力显著提升,但在科学数据体系建设方面还存在缺乏系统规划、管理碎片化、缺乏高质量数据库、资源投入不足等问题。
第一,缺乏国家层面系统规划,跨部门统筹协调困难。已出台政策缺乏统一管理框架,出现多头管理、跨部门统筹协调困难的情况。由于缺乏跨部门协调机构,数据持有部门出于数据控制权、数据安全、知识产权等风险规避考虑,出现“不愿共享


