学术咨询

让论文发表更省时、省事、省心

元数据技术与电子文件管理关系探析

时间:2021年03月17日 分类:电子论文 次数:

社会信息化的趋势使得世界各国在政治、经济、军事等方面对信息基础设施的依赖性不断加强。 一方面,随着信息化与办公自动化(OA)程度的不断加深,传统的纸质文件与档案逐步被电子文件所替代,真正的无纸化时代在不久的将来就会成为现实。 由于电子文件较之传

  社会信息化的趋势使得世界各国在政治、经济、军事等方面对信息基础设施的依赖性不断加强‍‌‍‍‌‍‌‍‍‍‌‍‍‌‍‍‍‌‍‍‌‍‍‍‌‍‍‍‍‌‍‌‍‌‍‌‍‍‌‍‍‍‍‍‍‍‍‍‌‍‍‌‍‍‌‍‌‍‌‍。 一方面,随着信息化与办公自动化(OA)程度的不断加深,传统的纸质文件与档案逐步被电子文件所替代,真正的“无纸化”时代在不久的将来就会成为现实‍‌‍‍‌‍‌‍‍‍‌‍‍‌‍‍‍‌‍‍‌‍‍‍‌‍‍‍‍‌‍‌‍‌‍‌‍‍‌‍‍‍‍‍‍‍‍‍‌‍‍‌‍‍‌‍‌‍‌‍。 由于电子文件较之传统文件的较多的不同之处,使得管理原理与方法都要发生相应的改变‍‌‍‍‌‍‌‍‍‍‌‍‍‌‍‍‍‌‍‍‌‍‍‍‌‍‍‍‍‌‍‌‍‌‍‌‍‍‌‍‍‍‍‍‍‍‍‍‌‍‍‌‍‍‌‍‌‍‌‍。 另一方面,社会的不断进步使得人们对档案信息的价值也更加重视,对信息的利用也提出了更高的要求。 由于电子文件具有信息与载体的可分离性、信息的可操作性、信息的流动性、数字信息的不稳定性等特性,使得电子文件的真实性与完整性的鉴定变的非常困难。

电子文件管理

  所以,如何保证电子文件的信息真实性与完整性已经成为信息化时代电子文件管理领域最重要的问题之一。 元数据技术成为管理维护电子文件的最重要的工具之一。 由于电子文件元数据记录了电子文件的特征及其变化情况,是电子文件内容、结构、背景等信息的反映,所以掌握了电子文件元数据就可以对电子文件进行有效与安全的管理与控制,保证电子文件的完整性、真实性,从而保证其证据效力。

  一、元数据技术概论

  1.电子文件元数据的定义

  在计算机专业术语中,这样定义元数据:“元数据是关于数据的数据,是数字信息组织和处理的基本工具,为各种形态的数字化信息单元和资源集合提供了规范,普遍的描述标准和方法。 ”对于元数据的解读,各个领域由于对元数据应用的侧重点各不相同,对元数据的定义也各不相同。 最早将元数据引入到档案界的是美国匹兹堡大学的戴维-比尔曼,他在1992的“Documenting document”一文中首先使用元数据这一概念。 据文献分析,在档案或电子文件管理领域,元数据存在以下定义:

  (1)GB/T18894-2002《电子文件归档与管理规范》:“元数据指描述电子文件数据属性的数据,包括文件的格式,编排结构,硬件和软件环境,文件处理软件,字处理和图形工具软件,字符集等数据。 ”

  (2)ISO15489《文件管理国际标准》:“元数据是描述文件的背景,内容,结构及其整个管理过程的数据。 ”

  (3)何嘉荪教授在《电子文件管理元数据规范》一文中认为:“元数据是与电子文件的制作形成、运转、处理、储存、检索、传输和利用有关的数据。 它是在上述过程中自动随机,或由人工帮助产生的,可以独立于文件之外记录、积累、保存、管理和利用的信息。 人们可以通过它来帮助记录电子文件形成时的背景信息和软、硬件环境,记录文件的内容和结构以及整个的管理和检索利用过程。 ”

  简而言之,可以说:电子文件元数据是描述电子文件背景、内容、结构及其整个管理过程并可为计算机及网络系统自动辨析、分解、提取和分析归纳的数据。 它既可用于保障相关电子文件的真实性、完整性、一致性、关联性和长期有效性; 又可帮助对分布式网络环境下的电子文件进行有效的集成管理和协助提供集成服务,更是构建数字档案馆信息组织体系必不可少的工具。

  2.元数据的类型

  按照不同的分类方法,元数据可以划分为不同的类型。 以下主要是按照元数据的功能来划分类型。 元数据作为一种描述信息特征,组织、评价、识别、开发信息的结构化数据,具有多种类型。 具体来说主要有五类:

  (1)管理型元数据。 用来管理与支配信息资源的元数据,如信息收集、版权与翻版跟踪、排架信息、数字化标准选择、版本控制等。

  (2)描述型元数据。 用来描述文献信息结构、特征的元数据,如编目记录、专题索引、书目信息、文摘简介、网页链接等。

  (3)保存型元数据。 用来保存文献信息资源的元数据,如资源实体条件方面的文献,数据更新和移植方面的文献。

  (4)技术型元数据。 用来保证系统正常运转、管理系统的元数据,如硬件、软件操作源代码、文件压缩比率、格式、数据验证和安全等。

  (5)使用型元数据。 直接与用户接口挂钩的元数据,如用户记录、用户认证、用户消息管理、用户使用跟踪等。

  3.关于元数据的进一步认识

  由于元数据是一个比较新的概念,所以人们对元数据的认识还存有一定的误区,在此将对某些容易产生误区的方面进行阐述说明。

  (1)元数据并非一定以数字形式出现。 元数据的形式是多样化的,只不过是随着计算机等数字信息技术的发展,人们越来越频繁的生成并使用计算机所能够识别的数字式元数据,并且将原来已经有的元数据进行数字化。

  (2)元数据来源的广泛性。 元数据的来源非常广泛,可以由人类提供最初的元数据(例如作者、编者、使用者等提供的信息),也可以由计算机自动生成。 虽然随着计算机软硬件技术与知识的逐渐普及,计算机自动生成元数据在人类社会生活中所占据的比例越来越大,但是事实上计算机自动生成的元数据并不能替代传统意义上的提供者所生成的元数据。

  (3)元数据是改变的。 元数据不是一成不变的,元数据是在信息对象系统生命周期中生成并自然增加的。 元数据的变化同时也记录着文件发生变化的过程。 元数据首先被生成,接着被修改,甚至在某个阶段被摒弃。 相对电子文件生命周期来说,元数据也具有自己的生命周期。 但是,并不是随着电子文件的消失,该电子文件的生命周期就结束了,元数据的生命周期将远远比电子文件的生命周期长,在某种特殊情况下,甚至元数据的生命周期一直活跃。

  二、元数据在电子文件管理过程中的作用

  1.电子文件管理系统设计阶段

  根据“前端控制”思想,对电子文件全程的管理和监控措施应该向前延伸到电子文件管理系统的设计之中。 由于电子文件在系统中运转,这就要求我们在系统设计时尽可能将文件生命周期各阶段的管理要求设计在系统中,以优化管理功能,提高管理效率。 系统设计阶段是从电子文件的管理需求出发,根据电子文件在整个生命周期的运行规律及相关条件提出系统功能的需求分析并设计元数据模型。 元数据模型是文档管理设计的重要内容,由档案人员和计算机人员共同完成,档案工作人员主要对元数据的内容、属性、功能和工作模式提出专业要求,而计算机技术人员负责技术实现。

  元数据集将伴随电子文件始终,从文件创建之时便自动携带一个元数据表,随着文件的形成和运行,元数据不断得到补充和修改。 文件管理系统也生成系统管理元数据,用作记录系统操作日志。 元数据的操作大部分由系统自动完成,而对于系统无法胜任的工作,则由人工进行填补‍‌‍‍‌‍‌‍‍‍‌‍‍‌‍‍‍‌‍‍‌‍‍‍‌‍‍‍‍‌‍‌‍‌‍‌‍‍‌‍‍‍‍‍‍‍‍‍‌‍‍‌‍‍‌‍‌‍‌‍。 人工包括文件制作者、利用者、文件管理者和系统管理员。

  2.电子文件形成阶段

  电子文件形成阶段是指文件进入到文件管理系统中,系统将自动扑捉文件内容、背景、结构等信息填入元数据表(如:文件标题、文件编号、作者、日期等),然后作者对其他需要在此阶段填写的元数据(如:主题词、文摘、分类号、密级、保管期限、与其他文件的关系、写作意图、机构职责、事务处理流程等背景信息)手动填写,最后将文件锁定。 以后除了特殊原因外,用户无法擅自修改文件内容。 新形成的电子文件保存在临时文件库中。

  3.电子文件运行阶段

  电子文件在社会活动中产生,用于表达意图、进行联系、记述情况和作为凭证,和传统文件一样,有一个运转、办理和使用的过程,这便是电子文件的运行阶段。 电子文件在文件管理系统中运行时,元数据不断得到扩充,具体变化情况如下:①电子文件通过网络被送达给用户A,系统自动记录文件的出发地地址、传输路径、目的地地址及相关的身份验证信息。 用户A如果对其进行处理,系统会记录下此用户对文件的操作过程。

  用户要在一份类似《文件处理单》的电子表格中作必要的登记,并填写文件办理意见,如阅读人姓名、阅读时间、批注、相关文件等,然后由系统自动将这些内容导入到元数据表中。 ②完成这些操作后,文件被送到下一个用户N,然后重复步骤①的工作。 ③直至文件办理完毕,被保存在文件库中。 可以看出,文件在运行过程中,当文件内容在不断的补充和完善时,元数据表也不断得到扩充,可以说这些元数据是维护电子文件运转和办理的真实与安全的重要依据和参考。

  4.电子文件维护阶段

  电子文件维护阶段的工作宗旨在于保证电子文件的真实性、完整性、有序性、安全性与可用性。 维护工作具体包括:鉴定与归档、整理与保管、检索与利用、脱机备份管理等多个环节,元数据管理贯穿于电子文件维护阶段的各个工作环节之中。

  (1)电子文件鉴定与归档环节的元数据管理。 电子文件鉴定是电子文件管理中最难也是最具挑战性的环节,比纸质文件的鉴定更具复杂性和难度,而且电子文件形成的时候就应进行相应的鉴定。 此时,元数据将为电子文件内容鉴定和技术鉴定工作提供重要依据,如元数据中的作者职务、机构组织、文件主题、时间、密级、签署、保管期限、文件品质、利用频率等元数据元素都是鉴定时非常重要的判定依据。

  元数据不仅给文件的归档鉴定提供依据和凭证,而且它还将详细记录下归档鉴定的操作过程、责任者和鉴定结果等信息,并指示系统做出相应处理,同时这些记录鉴定信息的有关元数据要素又将被保存下来,作为下一次电子文件鉴定工作的基础和参考。

  归档的过程也是元数据运动的过程,首先元数据随文件一起被移入档案保管系统的档案库中,同时元数据自身也在不断的存取和补充之中。 电子文件进入档案保管系统需要经过一系列的验证和检查,这些验证和检查是针对文件和文件元数据两者同时进行,而且档案保管系统还将对文件进行归档处理,如加入数字签名或水印、档案号、归档时间、归档说明等,处理过程和结果都将补充到文件元数据中。 与此同时,系统也会对文件进行登记、定位保存等操作,此类信息将记录到系统相关管理元数据中。

  (2)电子文件整理与保管阶段的元数据管理。 整理时,由于电子文件所携带的元数据是文件内容、背景和结构特征的描述,并以结构化规范化的形式存在,所以文件的元数据在此阶段是系统的直接操作对象,系统通过继续补充元数据,并提取元数据的相关元素进行重组,来完成对文件的组织和加工。

  元数据还将依然担任过程跟踪和记录工作,记录管理系统对文件的操作轨迹。 保管时,电子文件元数据为信息保护技术提供装载平台和记录空间,记录文件保管的经过和结果,向系统管理员提供各种统计和维护数据,起到辅助管理的作用。 文档管理人员可以通过元数据提供的信息打印统计报表,了解电子文件的维护状况,从而为以后的维护工作做准备。

  (3)电子文件检索和利用阶段的元数据管理。 电子文件信息资源开发和利用不仅是档案工作者的责任,也是电子文件管理的目标所在。 电子文件的检索与利用工作包括:用户管理、存取控制、用户界面管理、检索、公布等。 为了达到满意的检索和利用效果,元数据将应用于电子文件检索与利用的每一个工作环节中。

  (4)脱机电子文件管理阶段的元数据管理。 把那些非现行的、同时又具有保存价值的电子文件导出信息管理系统,保存在磁带、磁盘和光盘中,甚至转换成缩微胶片,至此,电子文件进入脱机保存阶段。 这时候元数据就显得尤为重要了,它像一座桥梁,联系着系统与原文件。 由于文件不在系统中,系统只能通过保留在系统中的元数据了解原文件目前的状况和位置,保持与原文件的联系,实施对文件的管理。

  在检索利用的过程中,系统也只能完全根据元数据提供的信息来判断原文件是否满足用户的检索要求,然后决定是否将原文件返回到系统中接受调用。 元数据在电子文件管理中发挥着巨大的作用。 一是元数据具有静态映射功能,能够映射出电子文件的内容、背景技术等信息,反映了该文件的原始状态及其生成环境; 二是元数据具有动态跟踪功能,记录备案了电子文件创建、形成、使用以及载体和设备的更替、销毁全过程,能在动态中反映电子文件的真实与可靠。

  三、元数据的应用对于电子文件管理的意义

  元数据应用于电子文件管理解决了电子文件管理领域的三大难题:电子文件的长期可用、电子文件的真实性和电子文件的完整性。 破坏电子文件长期可用性、真实性和完整性的主要原因有以下几个方面:(1)文件存储载体受到物理损害; (2)计算机病毒或人为的逻辑损坏; (3)软硬件环境的升级; (4)人为的对信息内容的篡改。 所以,电子文件的真实与完整性远远不如纸质文件那么明显直观。

  电子文件论文范例:电子文件“电子化归档”相关概念辨析及浙江实践

  元数据以通用的语言规范格式来描述电子文件的内容和结构以及文件的背景,具有稳定性,不容易受到环境的影响。 另外元数据能够实时的跟踪和记录文件的操作与变化过程,为维护真实与完整提供有力的凭证。 此外,元数据的应用,改变了现有电子文件的管理模式与方法,大大降低了电子文件管理的风险,改进了电子文件的检索与利用,同时为分布式数字档案馆的信息组织提供了整合的工具与纽带,为实现电子文件的分布式管理创造了条件。

  参考文献:

  [1]刘家真.电子文件管理与实践.科学出版社,2003年版

  [2]刘嘉.元数据导论.华艺出版社,2002年版

  [3]何嘉荪.电子文件管理元数据规范.浙江档案,2005(4)

  [4]何宝梅.电子文件管理中元数据问题的研究述评.秘书,2003(6)

  作者:王云庆,刘振华

NOW!

Take the first step of our cooperation迈出我们合作第一步

符合规范的学术服务 助力您的学术成果走向世界


点击咨询学术顾问