学术咨询

让论文发表更省时、省事、省心

基于读者阅读偏好的书籍信息资源自动检索系统设计

时间:2021年09月13日 分类:经济论文 次数:

摘要:当前的书籍信息资源自动检索系统往往直接采用挖掘算法对信息进行检索,对共现词语的分析不足,因此在需要高查全率的检索中,存在查准率不足的问题。因此文中提出基于读者阅读偏好的书籍信息资源自动检索系统设计。硬件设计中设立异构多核的信息检索硬

  摘要:当前的书籍信息资源自动检索系统往往直接采用挖掘算法对信息进行检索,对共现词语的分析不足,因此在需要高查全率的检索中,存在查准率不足的问题。因此文中提出基于读者阅读偏好的书籍信息资源自动检索系统设计。硬件设计中设立异构多核的信息检索硬件结构。在软件设计中,首先根据我国中图分类规则,建立起分类树状结构,同时利用MFP⁃Miner算法对读者的阅读偏好进行运算,对偏好以及中图分类树状结构中出现的词语共现情况进行概念扩展根据此来进行检索。为了验证设计的系统是否满足设计初衷,使用所提系统及传统检索系统对某图书馆中的书籍信息进行检索。实验结果显示,文中设计的书籍信息资源自动检索系统的查准率在查全率提高的情况下,降低程度较低,满足设计初衷。

  关键词:自动检索;挖掘算法;阅读偏好;词语共现;分类树状结构;信息检索;概念扩展

图书馆论文

  0引言

  在图书馆信息化建设中,图书信息的自动检索可为读者提供更接近需求的检索结果,降低图书闲置管理的成本[1⁃3]。而国外对数字化图书馆的研究始于20世纪末期,比较典型的图书检索系统有:Libra系统、BibTip系 统等[4⁃5]。但早期的图书检索系统在使用中需要几个月的数据收集,同时存在冷启动阶段下推进内容偏差较大的问题。而国内的图书馆信息化起步较晚,随着国外图书推荐系统的应用,高校才开始逐步进行相关实验,与发达国家的图书推荐系统间存在差距[6⁃8]。

  图书馆论文范例: 图书馆阅读推广的问题表现与优化对策

  1基于读者阅读偏好的书籍信息资源自动检索系统硬件设计

  本文系统的硬件结构包含多个不同处理核,通过多个辅助核扩展,除了两个处理核外,还有内存控制器、外设控制器等,同时使用总线连接。本文在辅助核上设置BIU用来与总线相连接,包括信息控制单元ICU,并与主核进行通信,从而读取主核中的内容,控制ICU内部的直接内存存取模块,进行辅助控制,并与本地存储器LS直接进行数据交换。除了两个处理核外,还包括进行连接主存的内存控制器,以及其他IP核。而在本文系统中其他硬件构成沿用文献[2]中系统硬件。

  2基于读者阅读偏好的数据信息资源自动检索系统软件设计

  2.1书籍特征分类及相似度计算

  我国的图书馆分类法(中图分类法)是目前较为常用的图书分类法,其将数据分为5个基本类以及22个小类[9⁃11]。本文对数据的特征分类沿用中图分类法的分类框架,将分类法中每个子类,作为一个分类指向根节点,分类节点不断延伸,同时节点间的关联性逐渐下降。首先对两个节点间的公共祖先深度进行计算,而对结构汇总根节点的深度参数设置为0,同时依照下面方法对节点相似度进行计算,即:SIM(U,V)=DEPTH(LCA(U,V))MAX_DEPTH(1)式中:U,V代表在树状结构中的两个任意节点;LCA(U,V)代表U,V下最近的祖先节点;DEPTH函数代表节点深度计算函数;MAX_DEPTH为节点树中的深度最大值,并以常数的形式体现。

  2.2MFP⁃Miner算法挖掘读者阅读偏好

  MFP⁃Miner算法在挖掘中不需要产生最大频率的候选项目集,同时善于发现最大频繁项目集中的FP⁃Tree,不需再扫描事务数据库[12⁃13]。在算法的实现中,需要4个步骤:

  1)需要确定最大频率项目集集合,设项目集X⊂I,如果support(X)≥minsup,而对于X下的任意超集Y,均需满足support(Y)

  首先,为节点的项目名,即node⁃name;到达节点子路径数为node⁃count;父节点为node⁃parent;同名节点为node⁃link。在进行运算时,频繁模式树的父节点不存在的情况下,数值为null,而当同名节点不存在时,数值也可设置为null。在频繁模式树中,创建一个频繁项目头表,头表中的元素需要包括两个域,分别为存放频繁项目的域item⁃name,以及指向频率项目同名的节点链和第一个节点下的item⁃link。

  3)构造FP⁃Tree。根据上述建立的频繁模式树的概念,构造起FP⁃Tree。4)根据系统中需要的条件模式构造期条件频率模式树,对于项目头表HTable中任意一个存在的项目(设为ai),将其所对应的item⁃head域指向其中同名节点链下的第一个节点,且在任意节点的同名节点链中节点名称均与ai相同,而取出的所有前缀路径构成了项目ai的条件模式基,另外也作为ai下的条件频率模式树。

  3实验论证分析

  本文设计实验来验证设计的信息资源自动检索系统的可行性。在此使用本文设计的系统以及文献[2]、文献[3]、文献[4]中的自动检索系统来对某图书馆的书籍信息资源进行自动检索,判断系统的可行性。

  本文中,系统开发工具选用MicrosrftVisualStudio2008,系统开发环境为ASP.Net(.NetFramework3.5),IIS;语言脚本为C#,HTML,JavaScript,CSS,AJAX5;运行环境为Microsoft.NetFranmeworkSDK3.5,IIS;后台数据库为SQLServer2008,浏览器支持为IE6以上。而为了保证系统的运行,使用XilinxVirtex4ML403开发板中Powerpc405硬核作为系统的主处理器核。为了保证系统可以兼容32为的指令,在辅助核选择上采用32位的RISCSPE指令集,同时在ML403的开发板下,遵循64KBBlockRAM的特点。

  系统1为本文设计的信息资源自动检索系统,系统2为文献[2]中的自动检索系统、系统3为文献[3]中的自动检索系统、系统四为文献[4]中的自动检索系统。在查全率不断增加的情况下,系统检索的查准率不断降低,本文系统在查全率相同时,查准率均高于其他检索系统。使用了MFP⁃Miner算法的本文系统在对读者喜好书籍的检索实验中表现突出,而系统4查准率过低,并不具备对读者喜好书籍类型的检索能力。下面根据不同种类书籍,对其近似种类或关联内容书籍进行检索。

  4结语

  本文针对读者的阅读偏好设计了书籍信息的资源自动检索系统。从实验中可以发现本文设计的书籍信息资源自动检索系统的查准率较高,具有可行性。但在系统的结构中,只实现异构双核的系统结构,仅能添加一个辅助核,尚不具备多辅助核和联合系统的拓展。为了使以后书籍信息资源自动检索系统更加完善,将会向着对多核系统的方向进行深入研究。

  参考文献

  [1]陈斯斯,郭继军,杨颖.嵌套自动检索系统的微信小程序查收查引服务[J].中华医学图书情报杂志,2019,28(11):65⁃69.

  [2]李曙军,张宏杰,王海棠,等.基于场景理论的STAC课程数据库自动检索系统[J].吉林大学学报(信息科学版),2019,37(4):457⁃462.

  [3]林建.图书馆自动查收查引系统功能分析2:以CALIS和NoteFirst检索功能为例[J].兰台内外,2019(20):42⁃44.

  [4]王立铭,许婷珊,张玲,等.基于自主研发拉曼光谱仪的危化品标准拉曼谱图库及自动检索系统的建立[J].警察技术,2019(2):78⁃80.

  [5]张越,杨沐昀,郑德权,等,等.面向问答系统的信息检索自动评价方法[J].智能计算机与应用,2019,9(2):262⁃268.

  作者:朱湘君,何兴杰

NOW!

Take the first step of our cooperation迈出我们合作第一步

符合规范的学术服务 助力您的学术成果走向世界


点击咨询学术顾问