法规标准

行业标准

当前位置: 本站首页 >> 法规标准 >> 行业标准 >> 正文

DA/T 48-2009 基于XML的电子文件封装规范

作者:来源:国家档案局官网 阅读次数:日期:2010年06月01日

前 言

标准由安徽省档案局()提出。

本标准由国家档案局归口。

本标准起草单位:安徽省档案局()、北京北大方正技术人研究陀有限公司。

本标准主要起草人:李学香、黄玉明、王学武、周建武、胡华平、邓晓文、段丽琼、吴彬松、华婷、陈姗姗、朱霖露。

引 言

电子文件管理就是对其元数据和数据的收集、管理和利用。在电子文件管理过程中,需要维护电了文件元数据与数据的可靠联系。电子文件元数据可以嵌入在文件中,也可以通过系统与文件关联,还可以通过封装的方法与文件打包在一起。本标准规定了电子文件封装的格式和要求,依据本标准生成的电子文件封装包格式与计算机软硬件无关,是电子文件交换、长期保存和利用的有效形式。

本标准与 DA/TI 46一2009《文书类电子文件元数据方案》联系紧密,建议一起阅读。

正 文

1 范围

本标准规定了基于XML的电子文件封装格式和要求。

本标准适用于各级各类档案馆、机关、团体、企业事业单位和其他社会组织对文本文件和静态图像文件的文件级封装

2 规范性引用文件

下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文。凡是不注日期的引用文件,其最新版本(包括所有的修改单适用于本文件。

GB 2312一1980 信息交换用汉字编码字符集 基本集

GB/T 7408一2005 数据元和交换格式 信息交换 日期和时间表示法(ISO 8601:2000,IDT

GB/T 13000.1一1993 信息技术 通用多八位编码字符集(UCS 第1部分:体系结构与基本多文种平面(ISO/IEC 10646-1:1993,IDT

GB 18030一2005 信息技术 中文编码字符集

GB/T 18793一2002 信息技术 可扩展置标语言(XML1.0(W3C REFC一xml:1998,NEQ

DA/T 1一2000 档案工作基本术语

DA/T 46一2009 文书类电子文件元数据方案

ISO 14721:2003 空间数据和信息传输系统 开放档案信息系统 参考模型(Space data and information transfer systems一Open archival information System一Reference model)

3 术语和定义

DA/T 1一2000、DA/XT 46一2009 界定的以及下列术语和定义适用于本文件。

3.1 封装 encapsulation

将电子文件及其元数据按指定结构打包的过程。

3.2 封闭包 encapsulation package

封装(3.1形成的数据单元。

3.3 封装格式 encapsulation format

封装包(3.2的数据结构。

3.4 主文档 malin document

组合文件中作为最重要著录对象的文档,一般是归档文件整理或档案著录时列在首位的文档。

3.5 附属文档 attached document

组合文件中的从属文档,如附件、被转发文等。

4 总则

基于XML技术进行电子文件封逆的目的是利用标准的、与软硬件无关的XML语言将电子文件与其元数据按照规范结构封装在一个数据包中,以维护电子文件与其元数据的完整性,并保障两者之间的可靠联系, 实现电子文件目包含、自描述和自证明。

基于XML的电子文件封闭包的信息组织络构符合ISO 14721:2003定义的档案信息包(AIP模型。

本标准所称的电子文件数据是指计算机文件的二进制流,因应XML技术特点,在封装包中用Base64编码表示。封装的电子文件元数据包括DA/T 46一2009规定的元数据、封装新增的元数据(见6.1),以及依据DA/T 46一2009组配的元数据(见 6.2)。

DA/T 46一2009定义的元数据除件数(见DA/T 46一2009 的5.6.2外均适用于本标准,但部分元数据的约束性、可重复性在本标准中另有规定(见附录A

5 电子文件封装结构模型

本标准采用封闻技术,按指定结构封装电子文件数据、DA/T 46一2009和本标准第6章所规定的元数据。其结构模型,见图1:

澳门头数和尾数

6 封闭元数据

6.1 封装新增的元数据

为表达电子文件封装的层次结构,记录封装包自描述信息,本标准在DA/T 46一2009 基础上,新增与封装有关的元数据元素,见表1:

澳门头数和尾数

6.2 依据DA/T 46一2009组配的元数据

DA/T 46一2009中的实体标识符(见DA/T 46一2009的8.1与本标准中的文件实体(见 7.2.11、业务实体(见7.2.95和机构人员实体(见7.2.104组配,形成了特定语义的元数据元素,见表2:

澳门头数和尾数

7 元数据的描述

7.1 元数据的描述方法

本标准对元数据属性的描述方法与DA/T 46一2009的4.2规定的描述方法一致。A/T 46一2009中已描述的元数据在本标准中只引用编号,其属性描述见A/T 46一2009第5、6、7、8章。

本标准增加描述封装的电子文件元数据(DA/T 46一2009 规定的元数据,本标准第6 章规定的封装元数据的层次模型、XML元素属性、命名空间和源代码。

本标准所描述的元数据元素具有相同的命名空间:

http://www.saac.gov.cn/standards/ERM/encapsulation

7.2 元数据元素的描述

7.2.1 电子文件封装包

编号 M201
中文名称 电子文件封装包
英文名称 electronic records encapsulation package
定义 封装电子文件全部数据及其元数据的数据单元,简称EEP
目的 维护电子文件及元数据的完整性,保障两者之间的可靠联系,实现电子文件看包含、自描述和自证明
约束性 必选
可重复性 不可重复
元素类型 容器型
数据类型 ——
编码修饰体系 ——
值域 ——
缺省值 ——
子元素

澳门头数和尾数


信息来源 ——
相关元素 ——
注释 ——
层次模型

澳门头数和尾数

XML元素属性
——
源代码

澳门头数和尾数

7.2.2 封装包格式描述

编号
M202
中文名称 封装包格式描述
英文名称 encapsulation package format description
定义 描述EEP格式的文本
目的 提供EEP格式的基本信息,利用理解EEP版式和内容
约束性 必选
可重复性 不可重复
元素类型 简单型
数据类型 字符型
编码修饰体系 ——
值域 ——
缺省值 本EEP根据中华人民共和国档案行业标准DA/T 48-2009《基于XML的电子文件封装规范》生成
子元素 ——
信息来源 由封装电子文件的系统通过预定义值自动生成
相关元素 ——
注释 可根据实际情况在保留缺省值的同时扩展描述文本
层次模型

澳门头数和尾数

XML元素属性 ——
源代码

澳门头数和尾数

7.2.3 版本

编号
M203
中文名称 版本
英文名称 version
定义 EEP封装采用DA/T 48日版本
目的 用于区别不同版本的封装格式,利于电子文件的控制、管理和利用
约束性 必选
可重复性 不可重复
元素类型 简单型
数据类型 数据型
编码修饰体系 ——
值域 ——
缺省值 2009
子元素 ——
信息来源 由封装电子文件的系统通过预定义值自动生成
相关元素 ——
注释 ——
层次模型

澳门头数和尾数

XML元素属性 ——
源代码 <xs:element name="版本" type="xs:gYear" fixed="2009"/>

7.2.4 被签名对象

7.2.5 封装包类型

编号
M205
中文名称
封装包类型
英文名称
encapsulation package type
定义 封闭包按是否修订进行分类的结果
目的 标识封装包是否被修改,以维护电文文件的有效性
约束性 必选
可重复性 不可重复
元素类型 简单型
数据类型 字符型
编码修饰体系 ——
值域
缺省值 原始型
子元素 ——
信息来源
相关元素
注释
层次类型
XML元素属性

源代码

7.2.6 封装包类型描述

7.2.7 封装包创建时间

7.2.8 封装包创建单位

7.2.9 封装内容

7.2.10 文件实体块

7.2.11 文件实体

7.2.12 聚合层次

7.2.13 来源

7.2.14 档案馆名称

7.2.15 档案馆代码

7.2.16 全宗名称

7.2.17 立档单位名称

7.2.18 电子文件号

7.2.19 档号

7.2.20 全宗号

7.2.21 目录号

7.2.22 年度

7.2.23 保管年限

7.2.24 机构或问题

7.2.25 类别号

7.2.26 室编案卷号

7.2.27 馆编案卷号

7.2.28 室编件号

7.2.29 馆编件号

7.2.30 页号

7.2.31 内容描述

7.2.32 题名

7.2.33 并列题名

7.2.34 副题名

7.2.35 说明题名文字

7.2.36 主题词

7.2.37 关键词

7.2.38 人名

7.2.39 摘要

7.2.40 分类号

7.2.41 文件编号

7.2.42 责任者

7.2.43 日期

7.2.44 文种

7.2.45 紧急程度

7.2.46 主送

7.2.47 抄送

7.2.48 密级

7.2.49 保密期限

7.2.50 形式特征

7.2.51 文件组合类型

7.2.52 页数

7.2.53 语种

7.2.54 稿本

7.2.55 存储位置

7.2.56 当前位置

7.2.57 脱机载体编号

7.2.58 脱机载体存址

7.2.59 缩微号

7.2.60 权限管理

7.2.61 知识产权说明

7.2.62 授权

7.2.63 授权对象

7.2.64 授权行为

7.2.65 控制标识

7.2.66 信息系统描述

7.2.67 附注

7.2.68 文件数据

7.2.69 文档

7.2.70 文件标识符

7.2.71 文档序号

7.2.72 文档主从说明

7.2.73 文档数据

7.2.74 编码

7.2.75 电子属性

7.2.76 格式信息

7.2.77 计算机文件名

7.2.78 计算机文件大小

7.2.79 文档创建程序

7.2.80 数字化属性

7.2.81 数字化对象形态

7.2.82 扫描分辨率

7.2.83 扫描色彩模式

7.2.84 图像压缩方案

7.2.85 编码描述

7.2.86 反编码关键字

7.2.87 编码数据

7.2.88 文件实体关系

7.2.89 文件标识符

7.2.90 被关联文件标识符

7.2.91 关系类型

7.2.92 关系

7.2.93 关系描述

7.2.94 业务实体块

7.2.95 业务实体

7.2.96 业务标识符

7.2.97 机构人员标识符

7.2.98 业务状态

7.2.99 业务行为

7.2.100 行为时间

7.2.101 行为依据

7.2.102 行为描述

7.2.103 机构人员块

7.2.104 机构人员实体

7.2.105 机构人员类型

7.2.106 机构人员名称

7.2.107 组织机构代码

7.2.108 个人职位

7.2.109 机构人员实体关系

7.2.110 被关联机构人员标识符

7.2.111 电子签名块

7.2.112 电子签名

7.2.113 签名标识符

7.2.114 签名规则

7.2.115 签名时间

7.2.116 签名人

7.2.117 签名结果

7.2.118 证书块

7.2.119 证书

7.2.120 证书引证

7.2.121 签名算法标识

7.2.122 锁定签名

7.2.123 被锁定签名标识符

7.2.124 修改封装内容

7.2.125 修改标识符

7.2.126 原封装包

7.2.127 修订内容

8 电子文件的封装

8.1 封装策略

本标准参照ISO 14721:2003 定义的档案信息包(AIP模型,将电子文件以“件”(可以是自然件,也可以是组合件为单位“装订”在一起。

封装包中包含文件、收文处理单/文件拟稿标签、文件元数据、电子签名、封装描述信息等。

一个电子文件封装包中可以封装有多个文档(如正文与附件),一个文档可以包含多个版本(如正文的正本、定稿、草稿),文档的同一版本还可以包含不同格式的计算机文件(如同一正本的PDF格式编码和TIFF格式编码)。

8.2 封装包文件

依据本标准规定的信息组织结构对电子文件进行封装所形成的封装包是一个格式规范的XML文件,其扩展名为eep。

8.3 封装包文件命名

封装包文件的计算机文件名应和封装内容相关,用来查找、检索和利用电子文件封装包。它可以用电子文件号(M7表示,也可以通过自定义规则命名。

8.4 封装包类型

本标准以电子文件封装包是否修订为分类标准,将电子文件封装包区分为原始型和修改型。原始型封装包树型结构见A.1,修改型封装包树型结构见A.2。

8.5 修改封装

当封装包中的电子文件数据或其元数据被修改时,可依据修改型封装包树型结构(见 A.2构建修改型封装包。修改型封装包是在原封装包(除封装包格式描述、版本和锁定签名元素外的基础上增加封装一个修订层,修订层包含全部电子文件元数据、被修改的数据(当原封装包中的数据未被修改时,修订层引用该数据的标识符、电子签名、锁定签名和修订封装描述信息、封装包每修改一次增加一个修订层。

8.6 封装包验证机制

8.6.1 封装包规范性验证

封装包文件应通过schema(见附录B进行有效性验证。

8.6.2 版本控制

封装包中有两个元素(M203、M204 的属性“eep 版本”记录封装遵从的版本,用于对封装包的有效性检验。

8.6.3 电子签名

本标准中的电子签名是对被签名对象(M204所作的签名,用于对封装对象的完整性、有效性验证。本标准不建议在封装的计算机文件中使用电子签名。

8.6.4 锁定签名

锁定签名是对电子签名块(M233中的某一电子签名所作的签名。在修改型封装包中, 用于防止对修改型EEP的数据剥离。

8.7 二进制数据的处理

在电子文件封装包中,所有二进制数据均转化为Base64编码表示。

8.8 加密限制

电子文件封装包所封装的编码数据(M221不应加密。

9 XML技术要求

9.1 遵从的XML标准

EEP文件必须是遵从GB/T 18793一2002的格式良好的XML文件。

9.2 XML声明

EFEP文件必须由XML声明开始,声明形式如下:,

<? xml verslon="1.0" encoding="UTF一8" standalone="no" ?>

声明的具体要求如下:

——verslion属性值必须是“1.0”;

——encoding属性值默认是“UTE一8”,也可以是:“GB2312”、“GB18030?”;

——standalone属性可以缺省,若定义该属性,值必须是“no”。

9.3 XML 命名空间

EEP文件中应包括如下命名空间:

xmjns一 http://www. saac. gov. cn/ standards/上ERMV/encapsulation'"

9.4 XML根元素声明

EEP文件的根元素为<电子文件封装包>,该元素的声明形式如下:

<电子文件封装包xmlns="http://www.saac.gov.cn/standards/ERM/encapsulation"

xmlns:xsi="http://www.w3.org/2001/XMLSchema一instance"

xsi:schemaLocation="http://www.saac.gov.cn/standards/ERM/encapsulatibon eep.xsd">

注:eep.xsd是附录B定义的电子文件封装包schema计算机文件名。

9.5 字符集方案

在电子文件封装包中,可以使用如下字符集:

一一GB/T 13000.1一1993;

一一GB 2312一1980;

一一GB 18030一2005。

9.6 XML元素的约束性

附录A中定义的元数据约束性有:必选、条件选和可选,然而,XML元素的约束性只有:必选、可选,因此,在封装包XML schema定义时,部分XML元素的约束性不能对等于元数据的约束性(见附录B

9.7 XML元素属性标识方法

9.7.1 被签名对象(M204的属性“EEP 版本”用EEP封装所采用本标准的版本号表示。

示例:2009。

9.7.2 文档数据(M217的属性“文档数据ID”表示方法为:修改R一文档D一文档数据W。

其中“R”为EEP修改次数,原始EEP的R值为0,EEP每增加修改一次,R的值增加1。当文件组合类型(M41的值为“单件时,“D”的值为1;当文件组合类型(M41的值为“组合文件时,“D”用文档序号(M19表示。“W”为文档数据的顺序,以阿拉伯数字表示,从1开始,流水编号。

示例:修改0一文档2一文档数据2。

9.7.3 编码(M218的属性“编码ID表示方法为:修改R--文档D一文档数据W一编码 E。

其中“修改R一文档D一文档数据W”表示方法见9.7.2。“E”为文档数据中的编码顺序,以阿拉伯数字表示,从1开始,流水编号。

示例:修改0一文档2一文档数据 2一编码 2。

9.7.4 编码数据(M221的属性“编码数据ID”“引用编码数据ID”表示方法为:修改R一文档D一文档数据一编码E编码数据”。

其中“修改R一文档D一文档数据W一编码E表示方法见9.7.3。

示例:修改0一文档2一文档数据2一编码2编码数据。

9.8 XML元素的值域

DA/T 46一2009定义的元数据值域在本标准XML schema中表示方法不同。本标准规定枚举值的,表示已穷尽枚举,不应扩展;本标准没有规定枚举值的,可由用户结合实际扩展定义。

10 电子签名技术要求

10.1 电子签名形式

电子文件封装包中的电子签名指数字签名。

10.2 电子签名的强制性

本标准没有规定电子文件封装时必须使用电子签名,但鼓励使用电子签名。当电子文件封装包使用电子签名时,每个电子文件封装包有且仅有一个锁定签名。

10.3 电子签名方法

对被签名对象(M204进行签名时,被电子签名的部分从电子文件封装包中“<被签名对象>的第一个字符“<”开始至“</被签名对象>”的最后一个字符“>”结束。

对电子签名块(M233中被锁定的电子等名进行签名时,被电子签名的部分从“<签名结果>”的第一个字符<”开始至“</签名结果>的最后一个字符“>”结束。

10.4 对被签名数据的要求

数据被签名时应满足以下要求:

a) 被签名的数据必须采用Unicode字符集或在签名前转换为Unicode字符集。

b) 所有签名数据中的空白字符必须被删除。空白字符包括tab(0x0669、回车(0x000D、换行(0x000A)和空格(0x0020)。

c) Unicode 字符的UTF一8编码二进制流用于签名和验证。

d) 编码数据(M221元素有两个属性,递交签名时,属性的文本顺序应与该元素属性的声明次序-一致。

10.5 算法要求

符合《中华人民共和国电子签名法中关于“可靠的电子签名规定的签名算法均合法、有效。

10.6 签名结果的编码要求

签名绪果(M61采用Base64进行编码。

10.7 证书要求

数字签名中使用的证书要求如下:

a) 所有证书必须是X.509证书。

b) 不能用加密的形式表示证书。

c) 签名人的私钥不能包含在封装包中。

d) 证书(M62应采用Base64进行编码。

10.8 电子签名的验证

当验证一个电子签名时其一系列证书必须全部验证。这些证书可在电子签名(M57中找到,或被证书引证(M63所指定。可以用下列三种方法中的一种来验证证书的真实性:

a) 访问证书管理机构(CA证书服务器;

b) 使用储存在电子文件保存系统安全区中的一个证书拷贝;

c) 与同一用户在相同时间段内所做的对其他电子文件签名的证书进行比较。


7.2.50 形式特征

7.2.50 形式特征

上一条:JGJ 25-2010 档案馆建筑设计规范 下一条:DA/T 47-2009 版式电子文件长期保存格式需求