学术咨询

让论文发表更省时、省事、省心

基于向量空模型的数字图书信息分类系统设计

时间:2021年05月17日 分类:文学论文 次数:

摘要:在实际分类数字图书信息时,受到数字图书停用信息的干扰,导致图书信息分类准确度不高,针对该不足,设计一种基于向量空模型的数字图书信息分类系统。硬件部分选用MPC755的处理器作为图书信息处理核心,设计一个CPU板卡,为了满足硬件数据冗余信息的输

  摘要:在实际分类数字图书信息时,受到数字图书停用信息的干扰,导致图书信息分类准确度不高,针对该不足,设计一种基于向量空模型的数字图书信息分类系统。硬件部分选用MPC755的处理器作为图书信息处理核心,设计一个CPU板卡,为了满足硬件数据冗余信息的输出,连接一个输出电路。软件部分利用向量空模型构建信息分类规则,以相同分类规则下的数据作为作用对象,构建一个停用信息过滤模块,最终完成对数字图书信息分类系统的设计。选用系统开发工具,连接分类系统硬件后,搭建实验测试环境,分别使用基于LSTM和CNN混合模型的分类系统、传统分类系统以及文中设计的分类系统进行实验,结果表明文中设计的分类系统信息分类准确度最高。

  关键词:数字图书;信息分类;向量空模型;信息处理;信息过滤;系统设计;实验测试

数字图书信息

  0引言

  向量空间模型是一个把文本文件表示为标识符向量的代数模型,主要应用在信息过滤、信息检索、索引以及相关排序过程中[1]。数字图书馆是用数字技术处理和储存各种文献的图书馆,从结构的性质上来讲,数字图书馆是一种多媒体的分布式信息系统,它能够将不同载体、不同地理位置的信息资源通过数字技术进行储存, 进而方便用户使用。为了增强数字图书馆的使用性,对数字图书馆内的各项文献进行分类,使用者可以更加方便快捷地查询得到所需的信息[2]。

  在向量空间模型的控制下,设计一种数字图书信息分类系统,能够为不断优化的数字图书馆各项性能提供帮助。国外针对数字图书信息分类系统研究起步较早,各个发达国家大学研究者在各个算法的支持下,现已形成了支持不同功能的信息分类系统[3]。国内在设计数字图书信息分类系统方面起步较晚,从整体的技术水平上来讲,该项技术还处于发展阶段,仍需不断研究发展。

  图书馆评职知识:图书馆课题题目有哪些

  1信息分类系统硬件设计

  1.1CPU板卡的设计

  数字图书信息分类系统处理的数据信息较多,所以在设计CPU板卡时,选用型号为MPC755的处理器,中央数据处理芯片选用MPC107桥芯片,将SDRAM作为储存电路的核心,以FPGA作为CPU板的控制器,在看门狗电路的控制下,连接一个支持总线协议芯片ARINC659。

  处理器MPC107接口拓展桥芯片,为了增强核心数据处理器的响应速度,控制处理器外部连接一个二级缓存,桥接芯片外部管脚连接一个数量级为60的线路,芯片另外一侧连接互联网PCI接口[4]。控制芯片内部的中央控制单元串联一个寄存器,寄存器负责调和中央控制单元外围逻辑模块的发送数据量。

  为了增强CPU板卡上数据的存储量,在板卡上SDRAM储存电路上并联两个UserFLASH存储器、一个BootFLASH存储器以及一个非易失性储存器,控制SDRAM负责储存信息分类时产生的指令数据,UserFLASH存储器1负责储存图书信息类别属性的数据,UserFLASH存储器2用来储存系统登录用户的数据信息,BootFLASH存储器负责储存系统引导分类时产生的冗余数据,非易失性存储器则用来储存分类系统启动时的配置信息[5]。

  在不同性质用途的控制下,设定上述存储器的容量。在上述储存器容量控制下,在各个芯片的总线路上设置一个复位监控芯片,负责监控整个CPU板卡的工作状态。在控制板接收到数字图书信息时,监控芯片会将该图书信息数据转化为信号,控制看门狗输入管脚连接FPGA中的硬件总线,设定FPGA寄存器中的计数数值为5,一旦达到该数值,复位芯片发出控制信号,完成一次复位,此时数字图书信息在硬件结构上完成一次分类[6]。在设计CPU板卡后,连接板卡各个硬件元件形成一个稳定运行的硬件连接电路。

  1.2硬件连接电路

  在上述硬件板卡的控制下,数字图书信息存在多种冗余资源输出,所以在设计硬件连接电路时,设计一个输出电路,实现硬件结构对数据的容错功能[7]。在各个硬件元件的线路电压处放置不同数值的电阻,维持各个硬件元件的电压稳定,设定整体电路的电压数值在3.3~8V之间,在硬件元件少的支路上放置低阻抗且数值为10Ω的电阻,控制在相同时刻下,输出一个驱动负载,形成的输出电路。

  在其中的的输出电路结构控制下,控制板卡内控制处理器连接管脚6,数字图书信息通过管脚2进入到核心的处理单元中,经过核心硬件的处理后,经由管脚5输出。控制核心处理板通过FPGA总线连接存储器构成的储存电路,在存储器自带功能的控制下,实现硬件电路的外部扩展[8]。

  在线路总线的另一侧采用异步串行的接口方式,合理布局CPU处理板与储存电路走线位置。结合RS422标准四线制规范数字图书信息数据的走向。使用处理器与桥芯片集成的UART模块功能,设定电路内的电平转换形式。系统硬件电路采用一个整体电源模块进行供电,在储存电路以及输出电路的控制下,将硬件的供电需求划分为两个部分,第一个部分为整体的硬件电路供电,第二部分为CPU板卡内的芯片处理器供电,在整体电源与硬件芯片的连接线路上放置一个电压转换器,为了满足硬件元件与电路之间的稳定,稳压器选用型号为AMS1084⁃3.3V的三端稳压器[9],最终完成对图书信息分类系统硬件的设计。

  2信息分类系统软件设计

  2.1利用向量空模型构建信息分类规则

  在利用向量空间模型构成信息分类规则时,转化数字图书信息为空间向量[10],假设一次分类过程中数字图书信息集中含有n个数字图书信息文档,每个信息文档中含有m个不同的特征项,各个特征项相互独立,则存在如下数量关系:d=t·wk(1)式中:t表示信息特征项;wk表示特征项在图书信息中的权重。假定(t1,t2,…,tm)是一个y维的坐标轴,根据其内部不同的坐标数值,计算得到数字图书信息的特征向量,则其可表示为:Vd=dwk(2)式中:Vd表示文本中的特征向量;其余参数含义不变。整合相同数值的信息为一个集合D,该集合可表示为:D=éëêêêùûúúúVd1Vd2⋮Vdn(3)在上述处理过程下,就形成一个数字图书信息转化的过程。

  2.2功能模块的实现

  在构建的信息分类规则下,以相同规则下的图书信息样本为实现对象[12],构建一个停用信息过滤模块。在其中的停用信息过滤模块下,根据式(3)计算得到相似度数值,删除特定词汇表中数值小于3的词汇[13]。根据不同的数值,计算其对应的匹配度,计算公式可表示为:MI(t)=logA·N(A+C)·(A+B)(6)式中:N表示待匹配的所有信息;A,B,C分别表示不同类别的信息项;其余参数含义不变。将停用信息筛选出后,利用软件线程池的LinkList链表作为线程分类任务[14],在ThreadPool接口处形成如图5所示的分类过程。

  基于上述实验准备,假定三种分类系统待分类的图书信息的类别为经济、生活、军体、社会、文学以及政法,每项图书信息种类准备50条,定义分类得到的标识符与准备图书信息内的标识符相同时,即为一次成功分类过程。

  在针对相同数量以及种类的数字图书信息时,三种分类系统表现出了不同的分类准确性,以其中平均准确率数值可知,文献[8]中的分类系统的信息分类准确率数值在77.91%左右,分类准确率较低。传统分类系统在实际分类时,最终的分类准确率数值在87.58%左右,准确率数值较高。

  而文中设计的图书信息分类系统最终的分类准确率在97.76%左右,与前述两种信息分类系统相比,文中设计的信息分类系统准确率数值最大,信息分类准确。保持上述实验环境不变,在300条信息数据的分类工作中,按照每组50条信息为分界,测量三种分类系统在分类后所需的分类时间,绘制分类指令响应时间结果图表。三种信息分类系统针对相同数量的待分类信息表现出了不同的时间响应结果,以最终300条数字图书信息为对比标准,文献[8]中的信息分类系统所需的时间在240ms左右,所需的信息分类时间较长。而传统信息分类系统所需的分类时间在180ms左右,分类信息所需的时间较短。

  而文中设计的信息分类系统所需的分类时间在90ms左右,与上述两种信息分类系统相比,文中设计的信息分类系统所需的分类时间最短。综合上述实验结果可知,文中设计的信息分类系统在实际工作时,对不同种类的信息分类更加准确,所需的分类时间最短。

  4结语

  随着数字图书馆不断地利用普及,如何对数字图书信息进行分类逐渐成为研究的重点,本文设计一种基于向量空模型的数字图书馆信息分类系统能够准确地划分图书信息,改善了现有数字图书信息分类系统分类时间较慢的不足,为今后研究数字图书信息分类提供了理论研究方向。

  参考文献

  [1]徐彤阳,尹凯.基于深度学习的数字图书馆文本分类研究[J].情报科学,2019,37(10):13⁃19.

  [2]韩东.基于向量机的体育运动视频自动分类方法设计[J].现代电子技术,2019,42(7):79⁃81.

  [3]巴志超,李湘东,马亚雪,等.基于主题语义扩展的混合类型数字资源分类研究[J].情报理论与实践,2018,41(5):143⁃149.

  [4]韦修喜,黄华娟,周永权.基于AP聚类的约简孪生支持向量机快速分类算法[J].计算机工程与科学,2019,41(10):1899⁃1904.

  [5]潘红光,米文毓,邓军,等.基于改进单关节信息传输模型的闭环脑机接口系统设计[J].控制理论与应用,2020,37(2):395⁃404.

  [6]许晓飞,常健,杨重柱,等.基于用户脸部信息的推荐系统设计[J].高技术通讯,2018,28(z2):972⁃979.

  [7]段建国,王彦森,谢楠.基于时间向量的多工序加工系统工艺路线重组建模与优化[J].计算机集成制造系统,2020,26(7):1814⁃1823.

  作者:况书梅,王莉莉

NOW!

Take the first step of our cooperation迈出我们合作第一步

符合规范的学术服务 助力您的学术成果走向世界


点击咨询学术顾问