学术咨询

让论文发表更省时、省事、省心

大数据视角下高校档案全生命周期管理

时间:2021年09月13日 分类:经济论文 次数:

摘 要 大数据提供了看待和处理信息的新视角和新工具。 高校档案具有大数据的特性,大数据要求高校档案管理更关注档案信息的数据化,改变传统档案收集观念,并赋予了高校档案全生命周期管理的新内涵:按全数据的要求对文件和档案进行统一管理; 以数据生命周期

  摘 要 大数据提供了看待和处理信息的新视角和新工具‍‌‍‍‌‍‌‍‍‍‌‍‍‌‍‍‍‌‍‍‌‍‍‍‌‍‍‍‍‌‍‌‍‌‍‌‍‍‌‍‍‍‍‍‍‍‍‍‌‍‍‌‍‍‌‍‌‍‌‍。 高校档案具有大数据的特性,大数据要求高校档案管理更关注档案信息的数据化,改变传统档案收集观念,并赋予了高校档案全生命周期管理的新内涵:按“全数据”的要求对文件和档案进行统一管理; 以数据生命周期管理统一文件生命周期和档案生命周期; 强化在前端进行数据的收集,为大数据分析提供充分的素材‍‌‍‍‌‍‌‍‍‍‌‍‍‌‍‍‍‌‍‍‌‍‍‍‌‍‍‍‍‌‍‌‍‌‍‌‍‍‌‍‍‍‍‍‍‍‍‍‌‍‍‌‍‍‌‍‌‍‌‍。

  关键词 大数据 生命周期管理 高校 档案

人事档案

  信息技术的发展日新月异,给我们带来了处理信息的新视角和新工具。 方兴未艾的大数据研究给各行各业的管理带来了历史性的变革,高校档案管理工作随之发展。 作为一类特殊而有价值的档案资源,从大数据的视角如何优化管理,成为当下高校档案管理研究的热门课题。 笔者主要从大数据视角看待高校档案全生命周期管理,探讨大数据对高校档案管理的启示和要求,通过大数据赋予档案全生命周期管理理论新的内涵。

  一、大数据的内涵

  大数据一般是指“无法用传统计算工具或手段处理的数据”,最早在航天或者气象等自然科学领域,由于数据不断大量地产生,且数据之间存在着弱关联性,需要对一整个集群进行分析。 后来有人总结了大数据的4V特性,即:“大量化”(Volume)、“快速化”(Velocity)、“多样化”(Variety)以及“价值化”(Value)。 从时代的发展来看,大数据标志着人类处理数据能力的又一次提升,我们发展了新的数据收集、分析和预测工具,包括云计算、人工智能等。 大数据时代提出的“不是随机样本,而尽量是全体数据”“不是精确性,而是混杂性”“不是因果关系,而是相关关系”等观念,既是源于数据处理技术发生了翻天覆地的变化,也是一种看待事物的新视角。

  二、大数据视角对高校档案管理的启示

  从大数据视角思考高校档案管理,不难得出以下的启示。

  1.高校档案确实具有大数据的特性。 和各行各业的数据增长一样,高校档案数据也面临着指数级别的增长。 这主要得益于两个方面:一是原生电子档案的快速产生。 伴随着高校管理活动的开展,每天都在产生着大量有价值的档案信息,例如教学活动中产生的课程教案、科学研究中产生的实验数据、党政管理中产生的电子公文等。 二是传统载体档案数字化的积极推进。 技术的进步使高校传统载体档案的数字化成为可能,为了更高效地利用档案提供服务,高校档案数字化工作正在各地如火如荼地进行着。 以上海交通大学为例,截至2010年10月15日,上海交通大学档案馆馆藏档案已数字化3667407页,数字化信息资源约为2PB[1]39-40,且还在持续增长。 由此可见,高校档案资源正迈向大数据行列。

  2.大数据要求更关注高校档案信息的数据化。 档案信息的载体从古至今不断发展变化,纸张是被使用最久的档案信息载体。 过去,档案信息隐藏于字里行间,需要人工去识别。 前面提到,不少高校已经开展了档案数字化工作,但数字化工作往往只是通过扫描的形式把一些非数字化信息变成“0”和“1”的数字化形式以便于计算机阅读,扫描的数字化的内容还大多是以图像的形式储存,不能通过检索词进行检索,也就是数字文本没有数据化。 显然,只有对档案信息进行数据化后,才谈得上对档案大数据的深度分析和整合,才能提供智能化的预测等[2]4-7。 因此,大数据要求在原有档案数字化的基础上,进一步进行档案信息的数据化工作。

  3.大数据意味着档案数据收集观念的改变。 过去,高校档案数据的收集往往局限于归档范围,不关注新的档案形式。 而在大数据时代,要求“不是随机样本,而尽量是全体数据”。 全数据的好处在于:它可以覆盖整个数据集的细节,让我们从不同的角度,更细致地观察和研究数据的各个方面,从而收获意想不到的观点,并且没有偏见。 而刻意筛选,往往让我们忽略了现象的细节[3]41。 因此,高校档案与大数据的结合意味未来高校档案数据的收集范围将大大拓展,更加多元化,更具实时性,包括高校网页、论坛和新媒体上的各类数据也将被列入档案收集管理的范围。

  三、大数据视角下高校档案全生命周期管理新内涵

  最早,由美国档案学者菲利普·布鲁克斯等在20世纪文件数量急剧增长的背景下提出“文件生命周期”的概念,后来,我国档案学界又提出了“档案生命周期”的概念,其实这是同一事物在不同发展阶段呈现的不同形态而已。 以归档为界,归档前为文件,归档后为档案,文件不一定都能归档。 在大数据时代,更应该泛化文件和档案的概念,因为它们的本质都是数据,应该统一用大数据的视角进行分析和处理。

  文件生命周期理论(实际上文件生命周期理论的内涵已经包括档案)指出,文件的运动具有阶段性,文件的运动可以分为现行、半现行和非现行三个阶段。 现行阶段便是文件的实施阶段,文件的信息主要为形成单位服务。 半现行阶段意味着文件的实际效用已经消失,对原有单位的服务功能逐渐减弱。 文件运动的非现行阶段是档案阶段,文件已经转化为档案,并存放在档案室(馆)以供社会利用。 而本文讨论的生命周期理论就是研究文件或档案生成、运动、变化的过程及规律的理论。

  生命周期理论最早关注的是不同阶段文件或档案价值变化的规律,进而指导文档管理工作。 然而,该理论在大数据时代亟待改革。 因为,在大数据时代,由于新的数据处理、分析工具的出现,使文件或档案的价值在各个阶段都能有所体现。 因此,过去通过人为手段筛选、鉴定档案价值的行为,应当有所弱化。

  另外,即使是历史的数据,也不代表没有现行的用处,因为大数据分析对未来的预测恰恰是建立在大量历史数据的基础上的。 谁也不能保证当前看起来没有价值的历史数据将来不会发挥其价值。 加上数据存储和处理的成本日益降低,使得大量历史数据的存放也成为可能。 因此,应重新认识高校档案全生命周期管理的内涵。 大数据视角下高校档案生命周期管理的新内涵应包括以下要点。

  1.按“全数据”的要求对文件和档案进行统一管理‍‌‍‍‌‍‌‍‍‍‌‍‍‌‍‍‍‌‍‍‌‍‍‍‌‍‍‍‍‌‍‌‍‌‍‌‍‍‌‍‍‍‍‍‍‍‍‍‌‍‍‌‍‍‌‍‌‍‌‍。

  过去档案管理流行“前端控制”理论,即在文件形成阶段对其积极介入管理,现在讲要在各信息系统中注重元数据的采集,其实都是一种“全数据”的观点。 即尽可能全面地收集数据,避免之后由于缺乏相关数据而难以管理利用档案。 信息系统中对文件的相应处理都应留下相应的数据,并积极将文件或档案中的各类信息转化为可用的数据,以适应大数据时代关注档案信息数据化的要求。

  同时,要弱化文件与档案的区别,无论是文件还是档案,对于大数据分析、预测都是必需的。 传统的归档过程是一个筛选、鉴定的过程,会过滤掉很多未来分析预测所需要的细节。 因此,在可能的情况下,要尽量“全”地将文件归档,泛化档案的概念,并将归档作为文件集中的一个手段,为大数据分析利用提供便利。综上,不论在文件的哪个阶段,都应以“全数据”的要求统一对文件和档案进行管理。

  2.以数据生命周期管理统一文件生命周期和档案生命周期。

  数据生命周期管理是一种基于不同阶段、不同数据特性实施的管理模型,以获取数据使用的最大价值,并有效地降低数据管理成本。 它能对数据进行主动管理。 数据生命周期理论认为,数据具有使用的生命周期。 随着时间的推移,它遵循的一个客观规律是:数据访问的频率随积累的数据量而发生变化。 因此,我们需要根据数据的访问频率来评估数据的价值,并采用低成本的数据保存方法对很多低价值的信息进行处理,使数据的价值大致与存储和管理成本相匹配,从而尽可能降低整体的数据管理和存储成本[4]71-75。

  因此,用数据生命周期管理代替传统文件与档案分界的生命周期划分管理法,不刻意区分是文件或是档案,仅仅根据实际使用频率来进行区别管理。 对于访问量或使用频率较低的数据,类似计算机将不经常访问的数据放在效率较低的存储器上的策略一样,可以逐步将其转移至效率较低的存储介质和处理工具上; 对于访问量或使用频率较高的数据,通过大数据工具进行预判,自动将其转移至效率较高的存储介质和处理工具上。

  这无疑是一种符合实际需要又能大幅度节省成本的作法。 当然,理论上,应该给每个数据平等的存储空间和处理能力,才符合大数据的精神。 但实际上,由于数据量的增大仍远远高于存储空间和处理能力等的提升,因此仍然需要考虑在尽可能“全”地保存文件和档案数据的情况下为不同数据分配不同级别的资源。

  3.强化在前端进行数据的收集,为大数据分析提供充分的素材。 数据在生成阶段是最活跃的,此时收集的成本要比后来收集的成本低。 举例来说,高校的电子文件原文,如果等到归档后再进行纸质的数字化工作,既耗费成本,实际效果也不一定好。 因此,在数据的生成阶段,就要充分考虑将来的应用场景,制定相对统一、规范的元数据采集标准,并尽量通过系统自动捕获元数据。

  同时,对文档使用和管理人员进行培训,使其真正将数据管理的标准落实。 元数据的标准应充分考虑数据的应用需求,而不能仅仅只考虑档案部门的归档要求,归档要求仅仅是数据应用需求中的一部分而已,还需要了解数据的行业特性和应用场景等,这样制定出的元数据标准才更有可操作性,而且更有利于数据充分发挥价值。

  大数据既是高校档案管理工作的机遇和挑战,又是不可逆转的时代潮流。 积极关注高校档案与大数据的结合,通过大数据视角重新理解并实践档案全生命周期管理,按“全数据”的要求对文件和档案进行统一管理,以数据生命周期管理统一文件生命周期和档案生命周期,并强化在前端进行数据的收集,这将是高校档案管理工作积极探索实践,发挥自身最大价值的必由之路。

  参考文献:

  [1]宁燕子.大数据对高校档案工作的影响分析及对策研究[J].科技视界,2015(1).

  [2]于英香.档案大数据研究热的冷思考[J].档案学通讯,2015(2).

  [3]维克托·迈尔·舍恩伯格,肯尼思·库克耶.大数据时代——生活、工作与思维的大变革[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013.

  [4]刘晓.大数据环境下数据中心的数据生命周期管理研究[J].中国金融电脑,2014(10).

  ★作者简介:徐钦梅,福建警察学院研究实习员,硕士研究生,研究方向为公共管理‍‌‍‍‌‍‌‍‍‍‌‍‍‌‍‍‍‌‍‍‌‍‍‍‌‍‍‍‍‌‍‌‍‌‍‌‍‍‌‍‍‍‍‍‍‍‍‍‌‍‍‌‍‍‌‍‌‍‌‍。

NOW!

Take the first step of our cooperation迈出我们合作第一步

符合规范的学术服务 助力您的学术成果走向世界


点击咨询学术顾问