时间:2021年02月06日 分类:电子论文 次数:
摘要:多源异构的跨媒体数据的快速涌现,改变了信息处理和分析的模式。文章研究分析了跨媒体智能对知识服务带来的全新理念。文章首先介绍了跨媒体智能产生的原因,梳理了该领域研究的四大视角:知识表达、知识关联、知识推理和智能应用;随后,分析了跨媒体智能技术对图书情报机构在资源组织、知识挖掘、知识发现、知识呈现能力方面带来的挑战;最后,探析了四个应对方案:知识即服务的理念、知识挖掘应用的社会化、跨媒体知识图谱的探索以及知识服务的“小数据“化。
关键词:跨媒体智能;智能分析;知识服务;图书情报机构;跨媒体知识图谱;小数据
从信息时代向数据时代和智慧时代的发展历程中,信息的获取、处理和分析已经从单一的媒体逐步向文本、图像、视频、音频等多媒体交互融合的形式转变。文本已不再是信息的主要载体,信息的内容呈现富媒体化;信息的传播以更为灵活、多样和详实的方式进行,走向开放共享;信息本身呈现关联多样化,具有多来源和跨媒介的特征。目前,各种平台和形式上不同的媒体信息混合在一起,作为一个整体代表了全面的知识。人们已经开始认识到一种新的信息形式,即跨媒体信息。
近年来,随着人工智能技术的飞速发展,跨媒体智能分析技术取得了一定地突破。2017年7月,国务院正式颁布了《新一代人工智能发展规划》,明确鼓励知识服务技术的发展,强调重点突破知识加工、深度搜索等核心技术,实现对知识持续增量的自动获取,具备概念识别、实体发现、属性预测、知识演化建模和关系挖掘能力,形成涵盖数十亿实体规模的多源、多学科和多数据类型的跨媒体知识图谱[1]。
人工智能论文范例:新型环境下人工智能迎来的机遇和挑战
跨媒体智能作为信息组织与检索研究的新问题正得到计算机科学、图书情报学等领域的高度关注。笔者认为,跨媒体智能在商业领域得到普遍应用的同时,其具有的分析推理以及知识构建等特征将为图书情报机构就知识描述、知识组织和知识传递等方面提供一定的理论借鉴。本文在探讨跨媒体智能发展现状的基础之上,探析知识服务的跨媒体智能化问题,并就智慧时代下,图书情报机构如何应对挑战进行探讨。
1跨媒体智能概述
1.1跨媒体智能的产生
跨媒体智能是新一代人工智能的重要组成部分。2008年,Yang等最早提出了“跨媒体计算”的概念[2],2010年,Norvig等在Nature上撰文,对跨媒体进行界定,认为跨媒体是:文本、图像、语音、视频及其交互属性紧密混合在一起[3]。
2014年,Lazer等在“Science”上发表论文指出,解决大数据傲慢(原文为“bigdatahubris”)问题需要将多源数据融合并结合具有知识演化特性的智能分析方法[4]。通俗地说,跨媒体智能主要体现在将不同媒体之间传播与互动的信息运用人工智能技术实现媒体数据的语义贯通,实现数据智能分析、处理、概括和创造。目前,跨媒体智能没有一个统一的定义,学者大多从不同的角度进行界定。纵观多位学者的观点,跨媒体智能具有两个基本特征:多模态[5-6]、智能化[7]。
跨媒体智能的出现并非偶然。随着全球媒体数据爆炸式的增长,计算机网络、多媒体工具以及移动终端的广泛使用,当前知识传播的方式与以往不同,跨源、跨模态、跨属性的特征愈发明显。指向同一知识的信息可能会跨域图书、期刊论文、专利、报纸、微博、新闻站点、B站等多个媒体渠道;其模态也有可能跨越文本、声音、视频甚至是跨语种等多种形态实现交叉融合以及协同表达;而知识本身不仅包括其固有内容的自然属性,也包括了使用过程中的用户行为和用户偏好等社会属性。从单一有限媒体资源到海量多源异构媒体资源,再到媒体之间的关联和用户社群的介入,每一步都推动了跨媒体的发展和演变[8]。
1.2跨媒体智能研究焦点和重心
从具体实践和应用来说,跨媒体智能体现了不同类型媒体数据在多平台间的横跨,其本质是一种多模态数据的分析和融合。为此,在相关研究中经常以多模态数据、跨媒体分析等术语进行描述。为便于从宏观上揭示跨媒体智能领域的研究现状,本文选取WebofScience、EBSCO、EI、CNKI的期刊、学位论文、会议论文等数据库作为来源数据库,结合以跨媒体智能、跨媒体分析、多模态数据、Cross-Mediaanalysis、Cross-mediaIntelligence、MultimodalData等关键词进行检索,对在主题、题名或关键词中出现相关检索词的文献进行收集。并对各个数据库中重复收录的文献进行剔重,通过人工识别,将与跨媒体智能研究主题不直接相关的记录剔除,共获得848篇,其中英文文献687篇,中文文献161篇(数据收集截至2020年7月29日)。
2对图书情报机构知识服务的挑战
跨媒体智能的出现,知识的内容开始呈现多元化、富媒体化、关联化,知识服务也将具有智能化、开放共享等特征。图书情报机构需要具有将多种感知信息实现统一语义表达,以语义相通相容为媒介,实现跨媒体智能应用的能力。新的知识环境,正在给图书情报机构知识服务带来新的挑战。
1)资源组织的挑战。
近年来,随着我国高校图书馆大量采取E-fist的采购方案,并将Springer等数据库捆绑的印刷型文献资源转为电子资源,使得数字资源成为图书馆资源的主流,图书馆用户也更多的通过电子设备访问这些数字资源。与此同时,学术研究中的各种数据,如:实验的仿真数据和演示数据等也以原始的电子形式进行组织和存储[30]。
从形态上来看,这些数字化资源天然的具有跨模态的特征,它们以不同的形式反映自然和社会的知识。随着学科的融合发展,大量交叉学科研究以及跨学科合作研究的出现,如何将图书馆现有的数字资源,依据知识的内在关联,实现资源的交叉融合和协同表达,是图书馆资源组织面对的新挑战。为此,在智能化普及的当下,图书馆需要重新定义馆藏资源,利用新一代的人工智能技术整合自身资源,借助智能化转型促进资源与服务的一体化,迸发资源的活力。
2)知识挖掘能力的挑战。
国际科技医学出版社联盟(STM)在其发布的2021技术展望中提出,未来的数字出版物将会像GitHub一样进行发布,计算机将成为其主要的读者[31]。网络化的发展使得信息获取越来越方便,同时也带来了信息形态和交流方式的变化,知识的获取不在局限于静态媒体(如:图书或期刊),各种动态媒体(如:视频和音频)正在成为知识获取的主要形式。这使得我们常用的一些方法(如:互信息、TF-IDF等),在有效表征和描述这些形态各异的数据时,无法依靠简单的领域术语来进行精准搜索和发现。
3图书情报机构的应对
目前,知识本身走向数据化和可计算化[38],图书情报机构提供知识服务的方式、能力和技术基础也将发生转变。1)知识即服务的理念。数据即知识,知识即服务。英国数学家托马斯·克伦普在《数字人类学》一书中指出,数据产生于人类的各项活动中,其价值在于服务于社会。随着知识专业化程度的不断提高,对于普通用户来说,准确地理解新领域的知识结构和发展趋势的挑战性不断增强。
在一个错误和虚假信息呈指数增长的世界里,用户希望能够从拥有经验和专业知识的人那里获得可信的答案。图书情报服务机构应该建立基于情景的知识服务,从各种跨媒体来源收集和构建数据,对来源进行整理和验证,构建领域“知识图”和“专家网络”的服务机制,提供具有更多价值和功能的知识服务。大英图书馆LivingKnowledge的2015—2023发展战略中[39]认为,图书馆拥有大量原生数字内容,也应该作为数据与知识关联标准的专家,成为跨领域研究中心。 随着人工智能在语音、计算机视觉、自然语言处理等领域不断突破,人工智能正在发挥巨大的社会影响力。5G技术的成熟又将给人们带来移动通讯方式的改变,并带来万物互联的新时代。在这些技术的推动下,提供“知识即服务”帮助人们通过获得更多的知识和信息充实生活与工作成为常态。
4结束语
跨媒体智能分析是一个新生事物,是信息科学中一个活跃的研究领域,也是人工智能未来的一个重要方向。其发展还存在一些重要的挑战、不明确的地方和瓶颈问题需要解决,但它已经展示了新技术使资源组织、资源建设和资源利用的新的前景。无论跨媒体智能分析的发展面临怎样的困难,它都使得借助智能技术提供知识服务的模式越来越清晰。而随着跨媒体智能分析逐步进入实践应用,并向各个行业领域扩展,图书情报机构也将会发现自己全新的服务职责和理念。
参考文献
[1]国务院关于印发新一代人工智能发展规划的通知[EB/OL].[2020-07-24]. http://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm.
[2]YANGY,ZHUANGYT,WUF,PANYH.Harmonizinghierarchicalmanifoldsformultimediadocumentsemanticsunderstandingandcross-mediaretrieval[J].IEEETransactionsonMultimedia,2008,10(3):437–46.
[3]NORVIGP,RELMANDA,GOLDSTEINDB,KAMMENDM,WEINBERGERDR,
作者:阮光册1,夏磊2,周萌葳1