“元数据”的版本间差异

来自DAMAChina
跳到导航 跳到搜索
第59行: 第59行:
ISO的元数据注册标准ISO/IEC 11179中提供了用于定义元数据注册的框架。它旨在基于数据的精确定义,从数据元素开始,实现元数据驱动的数据交换。该标准由以下几部分组成:
ISO的元数据注册标准ISO/IEC 11179中提供了用于定义元数据注册的框架。它旨在基于数据的精确定义,从数据元素开始,实现元数据驱动的数据交换。该标准由以下几部分组成:


第1部分:数据元素生成和标准化框架。
* 第1部分:数据元素生成和标准化框架。
 
* 第2部分:数据元数据分类。
第2部分:数据元数据分类。
* 第3部分:数据元素的基本属性。
 
* 第4部分:数据定义的形成规则和指南。
第3部分:数据元素的基本属性。
* 第5部分:数据元素的命名和识别原则。
 
* 第6部分:数据元素的注册。
第4部分:数据定义的形成规则和指南。
 
第5部分:数据元素的命名和识别原则。
 
第6部分:数据元素的注册。


==== 非结构化数据的元数据 ====
==== 非结构化数据的元数据 ====

2023年2月15日 (三) 01:57的版本

元数据就是“关于数据的数据”。

元数据对于数据管理和数据使用来说都是必不可少的。所有大型组织都会产生和使用大量的数据,在整个组织中,不同的人拥有不同层面的数据知识,但没有人知道关于数据的一切。因此,必须将这些信息记录下来,否则组织可能会丢失关于自身的宝贵知识。元数据管理提供了获取和管理组织数据的主要方法。

业务驱动因素

数据管理需要元数据。元数据本身也需要管理。可靠且良好的元数据管理有助于:

  • 通过提供上下文语境和执行数据质量检查来提高数据的可信度。
  • 通过扩展用途来增加战略信息(如主数据)的价值。
  • 通过识别冗余数据和流程来提高运营效率。
  • 防止使用过时或不正确的数据。
  • 减少数据的研究时间。
  • 改善数据使用者和IT专业人员之间的沟通。
  • 创建准确的影响分析,从而降低项目失败的风险。
  • 通过缩短系统开发生命周期时间来缩短产品上市时间。
  • 通过全面记录数据背景、历史和来源,降低培训成本和降低员工流动的影响。
  • 满足监管合规。

如果组织的数据质量很高,那么组织可以从数据资产中获得更多价值。高质量的数据和数据治理工作密切相关,因为元数据解释了使组织能够运行的数据和流程,所以元数据对于数据治理至关重要。如果说元数据是组织中数据管理的指南,那么必须妥善管理元数据。元数据管理不善容易导致以下问题:

  • 冗余的数据和数据管理流程。
  • 重复和冗余的字典、存储库和其他元数据存储。
  • 不一致的数据元素定义和与数据滥用相关的风险。
  • 元数据的不同版本相互矛盾且有冲突,降低了数据使用者的信心。
  • 怀疑元数据和数据的可靠性。

良好的元数据管理工作,可以确保对数据资源的一致理解和更加高效的跨组织开发使用。

目标和原则

元数据管理的目标包括:

  • 记录和管理与数据相关的业务术语的知识体系,以确保人们理解和使用数据内容的一致性。
  • 收集和整合来自不同来源的元数据,以确保人们了解来自组织不同部门的数据之间的相似与差异。
  • 确保元数据质量、一致性、及时性和安全。
  • 提供标准途径,使元数据使用者(人员、系统和流程)可以访问元数据。
  • 推广或强制使用技术元数据标准,以实现数据交换。

成功的元数据解决方案的实施应遵循以下指导原则:

  • 组织承诺。确保组织对元数据管理的承诺(高级管理层的支持和资金),将元数据管理作为企业整体战略的一部分,将数据作为企业资产进行管理。
  • 战略指导。制定元数据战略,考虑如何创建、维护、集成和访问元数据。战略能推动需求,这些需求应在评估、购买和安装元数据管理产品之前定义。元数据战略必须与业务优先级保持一致。
  • 企业视角。从企业角度来确保未来的可扩展性,但是要通过迭代和增量交付来实现,以带来价值。
  • 潜移默化。宣导元数据的必要性和每种元数据的用途;潜移默化其价值将鼓励业务使用元数据,同时也为业务提供知识辅助。
  • 便捷访问。确保员工了解如何访问和使用元数据。
  • 质量。认识到元数据通常是通过现有流程(数据建模、SDLC、业务流程定义)生成的,所以流程所有者应对元数据的质量负责。
  • 审计。制定、实施和审核元数据标准,以简化元数据的集成和使用。
  • 改进。创建反馈机制,以便数据使用者可以将错误或过时的元数据反馈给元数据管理团队。

基本概念

数据和元数据

元数据也是一种数据,应该用数据管理的方式进行管理。组织面临的一个问题是,如何在元数据和非元数据数据之间划分界限。从概念上讲,这条边界与数据所代表的抽象级别有关。例如,美国国家安全局对美国人使用电话的监控情况报告中,电话号码和通话时间通常被称为“元数据”,这意味着“真实”数据只包括电话交谈的内容。在IT领域的常识是电话号码和通话时间也只是普通数据。

为了管理元数据,一个组织不应该担心理论上的区别,相反,他们应该准确描述定义需求,重点关注元数据能用来做什么(创建新数据、了解现有数据、实现系统之间的流转、访问数据、共享数据)和满足这些需求的源数据。

元数据的类型

元数据通常分为三类:业务元数据技术元数据操作元数据。注意这种分类是根据来源而不是使用方式。就使用而言,不同类型元数据之间的区别并不严格,技术和操作人员可以使用“业务”元数据,也可以使用其他类型元数据。

元数据注册标准

ISO的元数据注册标准ISO/IEC 11179中提供了用于定义元数据注册的框架。它旨在基于数据的精确定义,从数据元素开始,实现元数据驱动的数据交换。该标准由以下几部分组成:

  • 第1部分:数据元素生成和标准化框架。
  • 第2部分:数据元数据分类。
  • 第3部分:数据元素的基本属性。
  • 第4部分:数据定义的形成规则和指南。
  • 第5部分:数据元素的命名和识别原则。
  • 第6部分:数据元素的注册。

非结构化数据的元数据

元数据的来源

元数据存储库的架构

管理活动

  1. 定义元数据战略
  2. 理解元数据需求
  3. 定义元数据架构
  4. 创建和维护元数据
  5. 查询、报告和分析元数据

工具和方法

实施指南

元数据治理