在数字经济蓬勃发展的当下,数据已成为关键生产要素。而可信数据空间,作为新兴的数据流通利用基础设施,正逐渐崭露头角。那么,什么是可信数据空间?又将如何影响数据领域的未来走向?数据标准和可信数据空间又有什么关系呢?
2024年11月,国家数据局发布《可信数据空间发展行动计划(2024—2028 年)》,预计到 2028年,我国将建成 100 个以上可信数据空间。
2025年4月29日,第八届数字中国建设峰会“可信数据空间分论坛”上,“可信数据空间发展联盟”正式成立。
2025年7月16日,国家数据局综合司正式发布《2025年可信数据空间创新发展试点名单》。
《行动计划》中明确可信数据空间是基于共识规则、联接多方主体、实现数据资源共享共用的一种数据流通利用基础设施,可信数据空间能力见下图:
可信数据空间如同一个高度规范化的“数据安全集市”,为数据所有者、使用者、开发者等多元主体提供可信赖的协作生态。在这一生态中,各方能够基于统一规则实现数据的安全流通、价值交易与协同创新。而支撑这一体系高效运行的核心之一,正是数据治理的三大支柱:
01、标准化的数据语言(确保数据可读)
02、高质量的数据内容(保障数据可用)
03、强防护的数据安全(明确数据敢用)
在可信数据空间中,高质量的数据是实现数据流通和价值创造的基础。“建设可信数据空间首先需要解决数据流通中‘不敢’‘不愿’和‘不能’的问题。”这正是数据治理解决的核心痛点。
数据治理旨在确保数据的质量、安全、合规以及有效利用。通过在数据清洗、整合、标准化等过程中进行处理,提高数据的准确性、完整性和一致性,从而为可信数据空间提供可靠的数据资源。
可信数据空间的建设和运行,也为数据治理提供了新的场景和挑战。在可信数据空间中,涉及到多方的数据交互和共享,这就需要更加严格的数据治理机制来保障数据的安全和合规。同时,可信数据空间的发展也促使企业和机构不断完善数据治理体系,提高数据治理的水平。
01、数据标准在数据流通中的应用
在可信数据空间中,数据标准是实现数据流通的关键。不同的企业和机构可能采用不同的数据格式、编码方式和数据定义,这就导致数据在流通时容易出现不兼容的问题。而数据标准可以统一数据的格式、编码、定义等,使得数据能够在不同的系统和平台之间无障碍地流通,增强可信数据空间主体间的协作能力。
02、数据标准对数据质量的支撑
数据标准有助于提升数据质量。通过明确数据的质量指标和规范,企业可以在数据采集、存储、处理和使用的全过程中,按照标准进行操作,减少数据错误和重复,提高数据的一致性和准确性。例如,在数据采集阶段,规定数据的必填项、数据类型和取值范围等标准,能够确保采集到的数据符合要求,为后续的数据处理和分析提供可靠的数据基础。
03、数据标准在数据安全与合规方面的作用
在可信数据空间中,数据安全和合规至关重要。数据标准在数据安全和合规方面发挥重要作用。通过制定数据脱敏、加密等标准,确保数据在存储和传输过程中的安全性;通过明确数据使用的权限标准,防止数据的滥用和泄露。同时,数据标准也有助于企业满足相关法律法规对数据管理的要求,保障数据主体的合法权益。
01、制定统一的数据标准
企业和机构应根据自身的业务需求和行业特点,制定统一的数据标准。这包括数据格式、命名规则、数据定义、业务规则以及数据质量指标等方面的标准。在制定标准时,要充分考虑到数据的流通性和可扩展性,确保标准能够适应不同系统和平台之间的数据交互需求,同时也能够满足未来业务发展和技术创新对数据的要求。
02、建立数据标准管理机制
为了确保数据标准的有效执行,需要建立完善的数据标准管理机制。这包括设立专门的数据标准管理团队,负责数据标准的制定、维护和更新;建立数据标准的发布和培训机制,确保相关人员了解和掌握数据标准;建立数据标准的监督和评估机制,定期对数据标准的执行情况进行检查和评估,及时发现和解决问题。
03、加强数据标准的推广与应用
数据标准制定后,关键在于推广和应用。企业可以通过内部培训、宣传等方式,提高员工对数据标准的认识和重视程度,促使员工在日常工作中自觉遵循数据标准。同时,在信息化和数字化建设过程中,将数据标准融入到业务流程中,通过系统性的强制约束,确保数据的采集、存储和使用符合数据标准。
然而,面对大模型驱动的智能时代,数据标准管理正经历从“规则固化”向“动态适应”的阶梯式跃迁,如何将数据标准、大模型和可信数据空间结合起来,也是我们需要探索和深入的模式。
01、大模型助力数据标准的智能化制定(自动制定)
随着人工智能技术的发展,大模型在数据标准制定方面具有巨大的潜力。大模型可以对海量的数据进行分析和学习,发现数据的常用格式、编码方式以及数据之间的关联关系,自动识别数据中的模式和规律,从而为制定数据标准提供参考。
02、大模型进行数据标准的持续性监管(自动矫正)
在数据标准的持续落地过程中,大模型也可以发挥重要作用。通过大模型进行数据质量检测和监控,通过对数据的定期分析,快速发现不符合数据标准的数据,并及时进行预警和处理。同时,大模型还可以用于数据的自动清洗和修复,根据数据标准对不符合要求的部分数据进行自动调整和修正,提高数据处理的效率和准确性。
03、大模型推动数据标准的持续优化(自动补齐)
随着业务的发展和数据的变化,大模型可以持续对数据进行学习和分析,及时发现数据标准中存在的问题和不足,并提出优化建议。当业务流程发生变化或出现新的数据类型时,大模型可以通过对新数据的分析,为数据标准的更新和优化提供依据,确保数据标准始终能够适应业务发展的需求。
在大模型等新技术的推动下,数据标准的制定和应用将迎来新的机遇和挑战。企业和机构应积极把握这些机遇,通过制定科学合理的数据标准,建立完善的数据标准管理机制,充分发挥数据标准在可信数据空间中的价值,为数字经济的发展注入新的动力。
可信数据空间是数字经济的“高速公路”,而数据标准则是这条路上的“交通规则”。从国际竞争到国内治理,从工业互联到民生服务,数据标准正在重塑数据价值的释放方式。未来,随着大模型与标准体系的深度融合,数据的未来版图正在标准的力量下重塑,而你我都是见证者。