学术咨询

让论文发表更省时、省事、省心

文本分析方法在公共管理与公共政策研究中的应用

时间:2021年03月11日 分类:科学技术论文 次数:

【摘要】数据时代的来临深刻影响了社会科学的研究范式。在不断增长的社会数据中,文本数据扮演着重要的角色,公共管理与公共政策领域开始越来越多地应用文本分析。本文基于研究语料研究逻辑的类型学分析框架对文本分析在公共管理与公共政策研究领域的研究方法

  【摘要】数据时代的来临深刻影响了社会科学的研究范式。在不断增长的社会数据中,文本数据扮演着重要的角色,公共管理与公共政策领域开始越来越多地应用文本分析。本文基于“研究语料—研究逻辑”的类型学分析框架对文本分析在公共管理与公共政策研究领域的研究方法应用进行了研究综述。探讨了公共管理与公共政策领域涉及的文本分析研究在不同维度的分布情况,展望本领域发展文本分析方法的潜在路径。本文指出,文本分析将逐渐从分析文本的结构化特征向非结构化特征发展,从开展描述性推论向因果推论发展;为更好地实现上述发展进程,研究者应收集更为高频的文本数据,并尝试将文本数据与更加丰富的数据源相结合。

  【关键词】文本分析;公共管理;公共政策;研究综述

公共管理学报

  一、引言

  数据时代的来临深刻影响了社会科学的研究范式,基于数据驱动的研究已经成为科学发展的重要趋势之一(TansleyandTolle,2009)。在不断增长的社会数据中,文本数据扮演着重要的角色。得益于数据技术的迅猛发展以及数字设备的广泛应用,政策文献、社交媒体、法律文书、档案史料、访谈资料、宣传文案、消费者评论等多样化的文本数据逐渐得到发掘,为研究者提供了更加丰富的实证素材和更为多元的研究视角。 公共管理与公共政策领域也开始越来越多地应用文本分析。截至2019年12月,WebofScience核心合集中公共管理与公共政策相关学科收录的以“textanalysis”(文本分析)为主题的研究超过8000篇,CNKI数据库中CSSCI和核心期刊的相关文献总量也已超过1000篇①。

  公共管理论文投稿刊物:公共管理学报设有公共管理理论论坛、公共政策论坛、公共管理现实焦点问题、政府治理案例分析、国外公共部门改革评介、信息技术与电子政务、经济全球化中的政府治理、公共项目管理、公共人力资源管理、公共管理教育等。

  2005年以后文本分析开始在本领域的英文文献中逐步推广,2012年以后相关的中文文献也越来越多地使用文本分析方法。此后,文本分析的学术关注度迅速增长,2016年以后一直维持在较高水平,已经在本领域的方法论体系中占有一席之地。公共管理及其相关领域已经广泛地应用文本分析,但与经济学、管理学、政治学等公共管理的母学科相比,公共管理领域的文本分析深度还较为欠缺。

  上述学科在意识形态挖掘、投资者情绪、消费者意见等领域已形成了较为系统的文本挖掘策略,并结合文本挖掘开展了一系列因果推论研究。②但在公共管理领域,绝大多数研究仍然停留在简单分类和基于手工编码的观点提取层面,越来越不能够适应大数据时代的社会科学发展需要。大部分公共管理学者仍没有充分理解哪些文本挖掘工具能够进一步拓展经典理论问题的研究视野(Hollibaugh,2019)。

  Hollibaugh(2019)在JournalofPublicAdministrationResearchandTheory(《公共行政理论与研究杂志》)发表的文章中尝试对公共管理领域的文本分析进行总结,但该文主要侧重结合案例阐释文本分析流程,较少涉及对于文本分析应用规律和发展趋势的探讨。因此,本研究以公共管理与公共政策研究者的视角对文本分析方法进行梳理。首先构建“研究语料—研究逻辑”的2∗2类型学分析,并以此为基础探讨本领域应用文本分析的相关研究在不同象限的分布情况;然后结合文本分析的发展趋势,讨论本学科发展文本分析的潜在路径和需要关注的问题。本文讨论的“公共管理与公共政策”包含一切以公共事务为对象的管理和政策研究。为反映大数据时代的学术发展趋势,综述以定量文本分析为主。

  二、分析框架

  文本分析与公共管理与公共政策研究的结合是本文关注的核心议题。本文基于“研究语料—研究逻辑”的类型学分析框架对文本分析在公共管理与公共政策研究领域的研究方法应用进行了研究综述。这一框架的构建有以下考虑。第一,方法论体系综述应当体现对于方法论核心要素的关注。对于文本分析研究方法而言,“研究逻辑”和“研究语料”分别回答了“为了研究什么”和“利用什么进行研究”两个方法论体系中的核心问题。特别地,在文本分析中“研究语料”较为集中地以语料的形式呈现,故本文选取“研究语料”及“研究逻辑”作为分析的基础维度。

  第二,该分析框架满足类型学研究“独立且穷尽”的基本原则(Minto,1996)。“研究逻辑”维度被划分为描述性推论和因果推论,“研究语料”维度被划分为形式特征和内容特征,理论上构成了所有文本分析研究的完备划分。第三,选择“研究逻辑”和“研究语料”两个维度进行分类,可以更好地呈现文本分析方法的发展趋势。以下对不同维度进行简要论述。

  (一)“研究语料”维度:文本的形式特征/内容特征语料是经过科学抽样和处理生成的数字化文本,构建高质量的语料库是进一步挖掘文本隐含知识的基础和前提。本文选取“研究语料”作为分析框架的一个维度,将其分为文本的形式特征和内容特征两个方面,主要回答了文本分析“利用什么进行研究”的问题。所谓“研究语料”的形式特征,主要指文本的发布时间、发布主体等外在特征;“研究语料”的内容特征,主要指文本的词语搭配结构、句式结构和语义特征等内在特征。上述语料的形式特征与内容特征对研究者理解文本起到不同作用,文本内容特征可以帮助研究者更好地理解文本“生产者”微妙的情绪和态度变化,文本形式特征差异可以帮助研究者更好地在海量文本间进行比较,理解不同角色“生产者”的立场差异(黄萃,2016)。

  (二)“研究逻辑”维度:描述性推论/因果推论“研究逻辑”是本文分析框架的另一个维度,主要回答了文本分析“为了研究什么”的问题。在本研究分析框架中,“研究逻辑”维度被分为描述性推论和因果推论。从方法论体系来看,推论是科学研究的基本目的,科学推论可以分为描述性推论和因果推论(Kingetal.,1994)。描述性推论侧重于利用观察值推理难以直接得出的结论,侧重于挖掘“是什么”。因果推论则更加深入,关注挖掘“为什么”,也更受到研究者关注。随着时间的推移,发展更加精确的因果推论已成为社会科学发展的重要趋势,文本分析作为一种新兴的社会研究方法也不例外。

  三、文本分析在公共管理与公共政策研究中的应用规律

  文本分析在社会科学中有着悠久历史。早期文本分析以质性解读为主。在结合社会历史背景的基础上,研究者可以通过分析文本中词句表述的变化,探究文本蕴含的态度与立场(黄萃,2016)。上述分析主要针对文本的内容特征,侧重于因果性推论。但随着数据时代的来临,这一模式越来越受到真实世界的挑战。

  在数据时代,文本数据的来源日趋多元,规模也显著增加,依赖研究者先验知识的文本解读在操作成本、可重复性等问题上都越来越不可持续(LoftisandMortensen,2020),研究者亟须发展适应大规模文本数据的分析方式。由于文本形式特征的提取远远简单于内容特征,形式特征也成了数据时代文本分析的起点。本研究沿着由形式特征到内容特征、由描述性推论到因果推论的逻辑,对于文本分析在本领域中的应用场景进行综述。需要说明的是,上述研究范式的转变并不是一蹴而就的,早期研究也或多或少地存在着一些质性文本解读的色彩。

  (一)基于形式特征的描述性文本分析形式特征是文本数据中结构化程度较高的特征,不同类型文本数据的结构特征有一定的差异。在常见的文本数据类型中,社交媒体数据的结构化程度往往较低,其形式特征包括发文时间、发文地点以及发文人在社交媒体平台登记的部分人口统计学特征等。政策文本数据的结构化程度往往更高,其形式特征包括发文主体、发文时间、文件标题、文件主题词、文件参照关系等(黄萃,2016)。通过对上述特征的分析,研究者可以挖掘丰富的公共管理与公共政策规律。

  四、文本分析的发展趋势

  结合文本分析的方法体系,本章根据文本分析的发展趋势,从4个方面论述其与公共管理与公共政策研究结合的潜在路径。首先,“研究逻辑”维度需进一步发展结合文本的因果推论,拓展文本分析的研究深度。其次,“研究语料”维度需进一步发展对文本非结构化特征的分析,拓展文本分析的研究广度。此外,还需要收集更加高频的文本信息,并尝试将文本数据与多源、多模态的数据类型相结合,为实现更加广泛的高质量因果推论奠定基础。

  上述4项趋势并不是孤立存在的。首先,“研究逻辑”的深化是进一步发展文本分析的核心,通过发展结合文本的因果推论,文本分析将进一步融入社会科学的主流方法论体系。其次,“研究语料”的丰富将进一步拓宽文本分析对象,从而为“研究逻辑”的深化提供更加多元的路径。最后,高频率文本数据收集与多源多模态信息融合是进一步深化“研究逻辑”的保障。通过采集更高频率文本构建纵贯性数据集,并融入更加丰富的情境与社会背景信息,将进一步提升基于文本的因果分析质量。

  五、总结与展望

  作为一种可观测的公共事务信息的物化载体,日益增长的文本信息为公共管理与公共政策研究者提供了一条可以依托的分析路径,补充和丰富了公共管理与公共政策学科的研究范式。基于高频率、多样化的社会文本数据,公共管理与公共政策研究者可以开展不同类型的研究工作。通过引用、参照、共同发文等,研究者可以结合网络分析,深入挖掘公共管理与公共政策活动中不同主体间互动模式的差异性及其历史演化进程。

  通过对文本的聚类分析,研究者可以实现对复杂社会信息的降维,理解主体注意力在不同问题间的分配,发掘不同群体对于特定问题认知逻辑的差异,找出问题解决中的“关键少数”和实践发展中的“新生事物”。通过对特定词组、语句乃至篇章的语义计算,研究者可以将文本特征融入因果推论过程中,既可以挖掘公共管理活动如何影响大众情绪感知的变化,又可以探究各方微妙的态度变化如何影响公共管理活动的绩效和结果。

  此外,文本分析还能够与不同类型的数据相整合,解决传统研究中面临的诸多难点。未来,文本分析将立足进一步发展结合文本的因果推论,从而更好地融入社会科学的主流方法论体系。在实际操作中,大数据时代的公共管理研究者可以关注包括但不局限于以下的研究路径,开展更高质量的文本分析。

  第一,结合文本长度、文本结构等因素,采用长短期记忆网络(longshort-termmemory)等更加先进的分类(聚类)技术,对于海量的政策文本、社会舆情文本进行更加精准的分类降维,更高质量地描绘特定问题背后的政策倾向与社情民意分布。第二,结合传统的手工编码过程,标注一批质量较高且具有公共管理理论价值的文本数据集合,运用(半)监督学习思路挖掘特定的非结构化语义特征。第三,基于纵贯性的文本数据集合,结合社会经济背景信息,在前两条路径的基础上,挖掘政策或社会事件冲击背后文本语义及主题分布的变化趋势,探讨变化背后的公共管理与公共政策意涵。

  此外,在发展文本分析的过程中,研究者还有一系列问题需要关注。首先,研究者应关注文本数据的生成环境。存在偏向性的社会环境将生成偏向的数据集合,从而导致偏向的分析结果。其中,算法的运用程度越高,偏向性会被放大得越明显。例如,审判文书可以帮助研究者理解特定领域的法治状况,但如果文书上网概率存在系统性偏误,分析结果就可能有偏差(唐应茂,2018)。社交媒体文本也可能存在类似问题。

  Barber

  参考文献

  常大伟.2020.我国少数民族档案文献遗产保护政策量化研究———基于128份政策文本的内容分析[J].档案学研究,(3):106-111.

  ChangDW.2020.QuantitativestudyontheprotectionpolicyofminoritydocumentaryheritageinChina—Basedonthecontentanalysisof128policytexts[J].ArchivesSciencetudy,(S3):106-111.(inChinese)

  范梓腾,谭海波.2017.地方政府大数据发展政策的文献量化研究———基于政策“目标工具”匹配的视角[J].中国行政管理,(12):46-53.FanZT,TanHB.2017.

  BigdatadevelopmentstrategiesofChineselocalgovernmentsbasedondocumentsquantitativemethods[J].ChinesePublicAdministration,(12):46-53.(inChinese)

  黄萃,任弢,张剑.2015a.政策文献量化研究:公共政策研究的新方向[J].公共管理学报,12(2):129-137.

  作者:黄萃吕立远

NOW!

Take the first step of our cooperation迈出我们合作第一步

符合规范的学术服务 助力您的学术成果走向世界


点击咨询学术顾问