1 适用范围
本标准规定了环境数据集说明文档的内容要求、格式要求和环境数据集说明文档模板。
本标准适用于环境数据集加工、使用及汇交过程中对环境数据集的说明。
2 规范性引用文件
本标准内容引用了下列文件中的条款。凡是不注日期的引用文件,其有效版本适用于本标准。
gb/t 2260-2007 中华人民共和国行政区划代码
gb/t 7408-2005 数据元和交换格式 信息交换 日期和时间表示法
gb/t 17295-2008 国际贸易计量单位代码
hj/t 417-2007 环境信息分类与代码
hj 720-2014 环境信息元数据规范
环办[2012]92 号 附件 3 污染源监督性监测数据元技术规定
环办[2012]92 号 附件 4 污染源自动监控数据元技术规定
环办[2012]92 号 附件 5 环境统计数据元技术规定
3 术语和定义
下列术语和定义适用于本标准。
3.1 数据集 dataset
可识别的数据集合。
3.2 环境数据集 environmental dataset
由环境保护业务相关的数据实例组成、遵循统一的数据模型、具有相对独立的业务语义的数据集合。
3.3 数据元 data element
用一组属性描述定义、标识、表示和允许值的数据单元。
4 环境数据集说明文档内容要求
4.1 内容要求
环境数据集的创建单位应编写环境数据集说明文档,以准确描述环境数据集。环境数据集说明文档应包含以下基本章节:
a) 概述;
b) 数据集标识;
c) 数据内容和结构;
d) 覆盖范围;
e) 数据质量;
f) 元数据。
可包括以下章节:
g) 数据分发;
h) 限制信息;
i) 数据维护;
j) 附加说明。
4.2 概述
概述应包括环境数据集说明文档的创建信息:
a) 数据集说明文档的名称;
b) 数据集说明文档的版本;
c) 数据集说明文档的发布日期;
d) 数据集说明文档的创建单位,包括单位名称、地址、电话、传真、电子邮件地址、网址。
可包括以下可选项:
e) 术语和定义;
f) 缩略语。
4.3 数据集标识
数据集标识应包括以下项:
a) 数据集名称:缩略描述环境数据集内容的标题,应包含该数据集的空间覆盖范围、时间覆盖范围、数据内容等;
b) 数据集摘要:对数据集内容概要说明的文字,应包含该数据集的主要内容、空间覆盖范围、时间覆盖范围、形成过程、遵循的主要标准等信息;
c) 数据集分类:数据集所属的分类,遵循 hj/t 417-2007 各种分类的取值规定;
d) 数据集提供方:包括数据集提供单位、提供单位电话、提供方电子邮件地址。可包括以下可选项:
e) 目的:生成数据集的目的;
f) 补充信息:对该数据集的其他描述信息,如说明该数据集与历史版本间的关系。
4.4 数据内容和结构
4.4.1 数据结构
采用 uml 描述环境数据集的数据结构,即环境数据集数据模型,描述数据实体-属性关系。用 uml 中类的概念表示数据实体,用 uml 类的属性概念表示实体的属性。
本标准采用 uml 定义的下列四种模型关系,并采用 uml 静态结构图表示数据实体间的关系:
a) 关联
关联用于描述两个或更多类之间的一般关系。如图 1 所示。
关联的方向必须说明。如果不指明方向,则假定为双向关联。如果是单向关联,关联方向在线段终点用箭头来标记。
图 1 关联示例图
b)聚合
聚合用于创建两个类之间的部分与整体的关系。在该关系中,一个类担当容器角色,另一个类担当容器的构件角色。如图 2 所示。
图 2 聚合示例图
c) 泛化
泛化表示一般化描述和具体化描述之间的关系,即超类与替代它的子类之间的关系。如图 3 所示。
图 3 泛化示例图
d) 角色
模型中使用“角色名称”描述源对象与目标对象之间的关系。在双向关联中,提供两个角色名称。如图 4 所示。
图 4 uml 角色示例图
4.4.2 数据内容
说明环境数据集所包含的数据元。若所包含的数据元在环办[2012]92 号文附件 3、环办[2012]92 号文附件 4、环办[2012]92 号文附件 5 中已有定义,可直接引用;若为第一次定义, 则应对数据元的属性进行详细描述,数据元属性见表 1。