元数据通常被称为“关于数据的数据”,目的是使数据能够被正确理解和解释。更确切地说,元数据是数据的内容、质量、所处语境等特征的基础定义或结构化描述。
“元数据引领好数据”,此观点在统计和大型数据库领域,已经得到普遍接受。这是因为元数据能使收集、使用和交换数据的所有人拥有对数据含义和表达的相同理解。在全国范围内得到认可和使用的元数据,即为数据标准。
为了正确理解和应用数据元,需要从不同角度对每个数据元进行描述和解释,即通过相关的元数据(meta data)项目来定义数据元。根据国际标准ISO/IEC 11179:信息技术——元数据注册(第二版)和其他国家的卫生数据标准化经验,数据元的基本构成是对象类、特性和表示,通过提供数据元所对应的对象类、特性及其表示等定义,可获得数据元的详细描述。
元数据基本结构图:
对象类 特性 数据元概念 表示 值域 数据元 数据集 术语