中国科学院科学数据库核心元数据标准2.0规则和术语
. 规则和术语
规则
1 数据集标识(URI)命名规则
数据集标识命名规则主要有下面四部分构成:
1)、标识字符组成:
(1)26 个英文字母,不区分大小写;
(2)"0,1,2,3,4,5,6,7,8,9"十个数字;
(3)"-"(英文中的连词号)。
2)、对于有注册域名的数据集拥有单位,采用域名注册分级模式定义其数据集标识:
DatasetURI:=<顶级域名标识>.<二级域名标识>…<终级域名标识>[.<数据集实体标识>]
3)、特别规定科学数据库项目内部所有数据集的标识为:
DatasetURI:=cn.csdb.<三级域名>(或 <主体数据库标识>)[.<数据集实体标识>]
4)、域名的注册有用户单位提出申请,经科学数据库中心认证、注册同意后方可正式
使用;数据集实体标识应有注册用户单位内部控制使用,同时要保证内部标识唯一,不冲突,
且需向科学数据库中心备案。
示例:
① 可将主体数据库纳米科技基础数据库的数据集 URI 定义为“cn.csdb.nano”;
② 可将化学专业主体库中药物与天然产物数据子库下的专利信息子集的数据集URI
定义为“cn.csdb.organchem.medicament.patent”。
2 服务标识(URI)命名规则
科学数据库项目内通用的服务 URI 命名格式为:
ServiceURI:= sdbs://+<Identity of Service Provider>/service/<Service-type>/ <Service-name>
1)、sdbs 表示科学数据库项目内所定义的各种服务(SDB Service);
2)、<Identitiy of Service Provider> 为统一分配给所有主体数据库的科学数据库域名,后
缀为csdb.cn,如纳米主体数据库的域名为nano.csdb.cn;
3)、<Service-type> 为服务类型,当前有五种类型的服务,分别dbms(数据集连接服务)、
middleware(中间件服务)、grid(网格服务)、www(网络服务)、ftp(下载服务);
4)、<Service-name> 由服务提供者自行命名,可以是由“/”分隔的层次名字空间;
据此,我们可为微生物所的网格服务之数据查询服务可命名标识为:
sdbs://micro.csdb.cn/service/grid/dataquery
3 网址和文件名
对于其他的资源,如文件名、计算机系统的网络地址等也应遵循Internet 的“统一资源
标识符-URI”的规定
4 日期
有关日期的规定,采用ISO 8601 关于日期的表示格式,即YYYY-MM-DD 的形式。其
中,YYYY 是公历的年份,MM 是一年中的月份,DD 是一个月中的天。例如:2003-04-01 表示 2003 年4 月1 日,2002-06 表示2002 年6 月,1999 表示1999 年。
5 时间
有关一天中时间的规定,采用 ISO 8601 关于时间的表示格式,即使用24 小时的计时
方法:hh:mm:ss。其中,hh 表示一天中自午夜之后的小时数,mm 表示某一小时自开始之后的分钟数,ss 表示某一分钟自开始之后的秒数。例如:23:59:59 表示午夜之前的23 点59 分59 秒,06:10 表示早上6 点20 分,12 表示中午12 点。
6 日期和时间
有关日期和该日期中时间的表示,采用ISO 8601 中同时表示日期和时间的格式:
YYYY-MM-DDThh:mm:ss 。其中的大写字母T 用于分割日期和时间。例如:
2003-04-01T13:01:02 表示2003 年4 月1 日下午1 点1 分2 秒。
3. 标准综述
对于元数据标准所定义的每个元数据元素(包括复合元素和数据元素),均采用九个属
性来描述,这九个属性如下:
表3-1 元素属性
属性名称 |
说明 |
中文名称 |
元素的中文名称 |
英文名称 |
元素的英文名称 |
标识 |
用字符串表示的元素标识 |
定义 |
对元素含义的解释 |
类型 |
元素所属数据类型,如复合类型(即该元素为复合元素)、整数类型、 实数类型、文本类型等。 |
值域 |
元素值的允许范围 |
可选性 |
元素是必选元素还是可选元素 |
最大出现次数 |
元素所允许的著录次数,如1(不可重复著录)、n(可重复著录无限次) 等。 |
注释 |
对元素的补充说明、著录格式的建议及其它 |
服务元数据
3.1.1 普通的服务通用元数据模型
图3-1 通用服务元数据模型
1 服务类型
服务类型指具有相同属性的服务所归属的类。对于相同类型的服务,一般说来所描述的
特征属性是相同的。服务类型一般应是值域为自由文本的文本内容,对于一个确定的服务,其归属类型只能有一个。
2 服务名称
服务名称一般为具体服务的正式公开名称,如果存在中文名称,建议为正式的中文名称。
3 服务URI
即服务唯一标识符,是根据服务唯一标识符命名规则为服务赋予的标识,一般说来是按
照有关机构、组织的有关标准而生成的规则字符串代码。。服务唯一标识符在整个服务体系内部是唯一的,用户或者系统可以据此获得对应的服务的信息和支持。
4 服务描述
服务描述主要是服务的说明,对服务有关方面内容的文本描述。由于在服务元数据中,
存在一些无法且也不必要具体描述的内容,或者说这些内容存在与否与服务的应用没有直接
必然的联系,服务提供者可以把这些信息在描述中给予说明,供用户使用时参考。该元素一
般应该为可选的。
5 服务属性
服务属性是描述服务时所需要的属性参数,反映服务特点的具体侧面特征。
可以从下面九个属性分别从不同的侧面来说明元素:
属性名称 |
说明 |
中文名称 |
元素的中文名称 |
英文名称 |
元素的英文名称 |
标识 |
用字符串表示的元素标识 |
定义 |
对元素含义的解释 |
类型 |
元素所属数据类型,如复合类型(即该元素为复合元素)、整数类型、 实数类型、文本类型等。 |
值域 |
元素值的允许范围 |
可选性 |
元素是必选元素还是可选元素 |
最大出现次数 |
元素所允许的著录次数,如1(不可重复著录)、n(可重复著录无限次) 等。 |
注释 |
对元素的补充说明、著录格式的建议及其它 |