欢迎来到实证政治学网!

摘 要近年来随着数据挖掘算法和新数据库的不断引入大数据国际政治研究逐渐发展起来。这一新的研究方向目前已在暴力冲突研究、反恐研究、国际政治传播学研究以及公共外交中取得了一定成果。大数据与国际政治研究的结合可以在事件预测与辅助决策、微观理论和中层理论研究以及宏观理论研究这三个层次上得以实现。然而大数据国际政治研究也必须应对数据和算法的不完善性所带来的挑战。大数据国际政治研究的未来方向不仅仅是加强实际应用而且更应该侧重完善学科的理论建构。为此应开发新的数据源倡导多种研究方法的协同运用大胆创造新的算法-数据实体建立新的研究合作机制并积极运用可视化技术。

关键词大数据数据挖掘国际政治国际关系


一、导言

大数据可以从两个层面加以定义。狭义的大数据是指体量异常庞大、结构复杂以至于传统数据处理技术难以应对的数据集。人们通常用“5V”“6C”来概括大数据的特点。所谓“5V”是指“Volume”(即数据集中的个案或字段数量庞大)“Variety”(即数据种类多样化)“Velocity”(即数据传输和处理的速度应大幅提高)“Veracity”(即数据应准确反映实际情况、提供精确信息)“Value”(即富有价值的信息能够从信息信息密度较低的数据中被提炼出来)。 所谓“6C”,是指大数据技术所涉及的6个主题“Connection”(数据收集装置和信息网络)“Cloud”(数据存储和数据需求)“Cyber”(模型与内存)“Content”(意义和关联)“Community”(分享与合作)“Customization”(个性化的信息获取)。 广义的大数据则被视为海获取、传输、存储、结构转化、清理、分析、解和应用读量数据(即狭义的大数据”)的方法、技术和模式。由于数据分析工作在海量数据处理过程中居于核心地位研究者进一步提出了大数据分析”(Big Data Analytics)的概念。

大数据为社会科学研究带来了新的理论视域和技术手段。大数据国际政治研究与大数据社会学、大数据金融 、大数据政治学 等一样是大数据与社会科学相结合后开辟出的一个前景广阔的研究领域。将大数据用于研究只不过是以前所从事的定量研究的自然延伸而已一方面实证研究的不断发展需要引入新的研究方法、数据和模型另一方面以往从事定量研究的研究者在了解了数据科学的基本知识(API的使用、数据库语言)可以顺利踏上基于大数据的探索之路。另外虽然多数国际政治方面的定量研究如分析战争死亡人数、军费、民主/集权程度等等只需处理体量较小的样本实际上对大样本数据的关注也一直存在。

在数据收集工作上早在1972兰德公司就建立了兰德恐怖主义年鉴”(RAND Terrorism Chronology)数据库;20世纪80年代美国政府就已开始使用这一数据库。 在冲突研究方面,Trappl等人 尝试利用C4.5决策树来预测冲突管理行为的结果。Kovar等人 探讨了利用数据挖掘算法来为事件数据的时间序列建模并进行事件预测的可能性。在预测系统方面基于QJMA(Quantified Judgement Method of Analysis)方法的TN-DM(Tactical Numerical Deterministic Model)模型也在20世纪70年代诞生了。它允许用户输入假想的冲突数据并据此对冲突的损失进行预测。 然而尽管这些研究均涉及大量数据的收集和使用但由于样本量和技术方面的限制这些研究尚无法被归入基于大数据的研究这一范畴。不过也有一些作品尽管在其产生之时并没有大数据这一提法但以今天的观点来看它们确实可以算是基于大数据的研究的雏形。比如,Mallery 探讨了利用文本分析技术为政治认知建模优化外交决策等问题。

2005年开始将大数据与国际政治研究相结合的成果开始不断出现。在数据资源方面研究者们已不再满足于COW(Correlates of War)WEIS(World Events Interaction Survey)等数据库而是开始更多地使用来自路透社、GoogleGTD(Global Terrorism Database)等数据提供方的资源。同时支持向量机、隐马尔科夫模型、贝叶斯模型平均、随机森林等数据挖掘方法也被引入研究中。借助不断丰富的数据、复杂的模型和先进的计算机技术国际政治与大数据的融合促成了一些具有很高学术价值或实用价值的成果。有鉴于此对这一领域目前的发展状况进行总结有助于我们了解这一研究方向的前沿议题、掌握关键研究方法洞悉现有研究的不足之处从而推动相关研究取得更大进展。

二、大数据国际政治研究的议题领域

大数据与国际政治科学的融合目前已在多个议题领域取得研究成果而暴力冲突研究、恐怖主义研究以及国际政治传播学和数字外交方面的跨学科研究则是研究成果较为集中的领域。

()大数据在暴力冲突研究上的应用

战争与和平是国际政治研究的核心议题。冷战后尽管大国之间爆发大规模战争的可能性降低但是边境冲突、局部战争、有外国力量干预的内战(甚至是冲突双方都受大国影响的内战)时有发生。借助大数据技术研究者们可以对冲突进行更深入的研究以期洞察关键动因寻找解决之道。

在对冲突进行的量化研究中一个重要的研究方向是根据事件数据的时间序列来抽取暴力事件的发生、变化模式。Schrodt利用隐马尔科夫模型来达到这一目的并考察了这一模型是否能有效预测1990年代发生在南斯拉夫的各类冲突。作者提取路透社相关新闻的第一句话进行了自动编码然后分别为高冲突星期序列(high-conflict-week sequences)和低冲突星期序列(low-conflict-week sequences)建立模型。在预测时模型会分别计算一个事件序列与以上两个序列相符的可能性进而做出判断。经过验证作者发现隐马尔科夫模型在预测政治事件时具有较高的稳健性。

Yonamine1997年至2011年间29个亚洲国家的约两百万条经自动编码的新闻事件进行了研究以探讨一国国内冲突对该国与别国的关系产生的影响。线性回归模型和多维样条模型显示一国的国内冲突并不会增加它与其他国家在接下来的几个月中爆发冲突的可能性但是却会使它在当月与别国发生冲突的可能性增加。

Zammit-Mangion等人借助贝叶斯分层模型和时空数据对冲突中的不确定性进行量化分析的方法并利用WikiLeaks Afghan War Diary中的数据对模型进行检验。Perry尽管并未进行国际冲突研究却结合格网化数据介绍了朴素贝叶斯和随机森林这两种机器学习的常用算法在政治事件预测方面的作用。

()大数据在恐怖主义研究上的应用

在恐怖袭击时有发生反恐话题热度不减的背景下大数据被广泛用于反恐研究。大数据可以在以下几个方面对反恐研究有所贡献恐怖活动预测、恐怖组织网络分析、恐怖组织宣传及文化分析以及以打击恐怖主义为根本目标的基础研究。

在预测恐怖活动方面,Petroff等探讨了利用隐马尔科夫模型和经过自动编码的事件数据进行预测的方法。用1990年至2009年间伊拉克和阿富汗的数据建立了模型两个模型的RMSFE值均接近0可见模型的预测效果是令人满意的。

值得注意的是受冷战的意外结束、发生在索马里和前南斯拉夫的冲突以及卢旺达大屠杀等事件的影响美国早在20世纪90年代中期就开始尝试利用计算机技术对冲突进行预测由其PITF(Political Instability Task Force)项目开发的模型可以提前两年对全世界的动荡事件进行预测准确率在70%80%之间。

在对恐怖组织网络进行分析方面,Fire等利用社会网络分析中的链接预测方法。近年来社交媒体的发展在为人们的交流沟通提供了巨大方便的同时也为恐怖分子提供了建立组织和策划活动的工具。Fire等设计了一个用于进行链接预测的机器学习模型并且强调尽管链测预测通常都被社交媒体用来向用户推荐好友同样也可用来寻找像恐怖组织这样的较隐蔽的社交网络。

Carley主张利用动态网络分析(dynamic network analysis)来对恐怖主义组织或个人的行为进行研究。与社会网络分析不同动态网络分析不但关注人与人之间的联系还关注人与知识、资源、任务、地点和组织等实体的关系并能够对人和组织的演化过程进行分析。借助这一方法研究者能够发现恐怖分子网络的弱点并且判断这一网络在外在干预下会发生怎样的变化。作者利用这一模型对基地组织的网络结构、精英人物、势力范围等进行了分析。

对恐怖主义宣传手段和文化进行研究有助于决策者采取有效措施消除恐怖主义的心理根源和文化根源。在这方面,SkillicornReid利用语义模型对吉哈德组织的两份电子杂志InspireAzan进行了研究。结果显示在两份杂志中告知性语言(用来传达关于敌对目标和技术手段的知识)、想象性语言(用来激发情绪并压抑理智)、欺骗性语言、吉哈德式语言(用来表达作者的思想)这四者均有较高的密度而文章的复杂程度与其他杂志相仿。这些特点说明吉哈德组织与国家一样能够掌握有效的宣传手段。

还有一些学者以分析恐怖组织为根本目的对算法进行了深入研究。比如,Husslage等对无中心恐怖组织的最优结构进行了探讨。一方面恐怖组织会避免让组织中的所有人认识所有人以免出现在一人被抓时其他人也会有危险的情况另一方面成员之间的熟识程度又不能过低因为这样会阻碍信息传递和行动协调。作者指出这两个方面可以分别用秘密尺度信息尺度这两个变量来衡量而恐怖组织的总体表现是关于这两个变量的函数恐怖组织越是能在这两个变量间取得平衡总体表现值越高。在对算法进行了详细介绍后作者对回教祈祷团在策划实施巴里岛爆炸时所组成的网络进行了分析。

Simari等设计了CONVEX算法以及通过加入权重而得到改良的CONVEXMerge算法。这两种算法的原理就是用代表行为体当前处境的向量与过去的个案进行对比并计算相似度。作者利用1980年至2004年中东地区多个种族政治群体(其中有许多群体都参与了恐怖活动)的活动数据对两个模型进行了检验预测准确率超过了95%

()大数据在国际政治传播学和数字外交跨学科研究中的应用

有些基于大数据的研究很难将其完全归入国际政治领域或传播学领域。因此更合理的做法是把这样一些研究看成是跨学科研究。

例如,Stockmann在对《北京晚报》和《人民日报》上关于美国的报道进行研究时试图弄清的问题是市场竞争压力是否会使媒体改变内容?作者指出1999年相比北京市民在2003年对美国的态度更具否定性因此假如市场竞争压力确实会使报纸为迎合人们的心理而改变内容的话那么2003年的报纸就会包含更多否定美国的内容———这一假设在研究中得到了证实。与此同时为了防止媒体过多批评美国媒体管理者会对带有某些重要内容的新闻(特别是关于中美关系的新闻)加以审查。因此报纸要想增加批评美国的内容就只能更多地报道那些不需要被审查的事件。作者于是提出如果市场竞争确实会使媒体改变内容的话就会看到各类报纸(特别是代表官方立场的《人民日报》)对不需被审查的事件的报道会增加———这一假设也得到了证实。作者最后的结论是中国政府无意丑化美国相反为了使中美正常交往在舆论中得到合法性就必须要求媒体不要过多批评美国从而避免在舆论中激起民族主义。

BaumZhukov为研究冲突报道模式而收集了来自113个国家的2252份报纸中关于利比亚危机的213406篇文章。结合事件数据和政治制度测量指标所作的分析表明民主国家和非民主国家对利比亚危机的报道存在着系统性的差异。与非民主国家相比民主国家的报纸更多地报道由反对派发起的非暴力集体行动且更多地报道由政府行动造成的人员伤亡但对由反对派的行动而导致的伤亡报道较少。

数字外交(又称电子外交”)———利用社交媒体达到外交目的———则是大数据、国际政治与传播学三者相结合的重要成果。随着互联网和社交媒体的快速发展以及传播学理论的不断进步一方面外交决策者发现社交媒体是一个高效率、低成本的公共外交工具借此政府可以实时发布信息、传播理念、应对危机事件并大量收集公众反馈另一方面非国家行为体甚至是个人借助互联网为沟通交流和组织动员提供的便利可以在国际舞台上发挥更大影响力。在这种情况下各国决策者逐渐认识到了数字外交的重要意义并纷纷将其纳入外交战略中。比如,2009时任美国国务卿希拉里·克里顿着手进行数字外交方面的工作。在她领导下国务院相关部门开通了194Twitter账户和200Facebook账户。在美国的带动和影响下英国、加拿大等西方国家也将数字外交提上了日程而伊朗、朝鲜等在国际社会中相对受孤立的国家也希望利用社交媒体发出自己的声音。无疑互联网已经成了各国争夺国际话语权、展现本国形象、获取国际舆论支持、对外国民众施加影响的电子战场。尽管未来的国际外交舞台仍然以政府对政府的行动为主要内容但是无法适应数字外交新形势的政府将会发现自己难以应对别国、甚至是本国的舆论和社会运动所带来的挑战。

成功开展数字外交以对于互联网技术、传播学、国际政治等学科的深刻理解为基础。总的来看以推进数字外交为目的而开展基于大数据的研究有两个核心研究方向一是利用空间分析、社会网络分析等方法研究如何扩大信息传播的有效性即如何让更多人接触到信息以及如何增强信息的说服力。为此研究者们可以利用大数据技术分析用户性格特点和浏览习惯、信息扩散网络、舆论领袖的作用以及政府的互联网行为与现实中的正式行为的相关关系等。另外值得强调的是正如电子商务网站可以利用各种推荐算法为用户提供个性化的推荐组合一样利用大数据和互联网技术数字外交领域的决策者同样可以让不同的用户得到具有差异性的内容或是以不同形式包装的同一内容。二是利用各类舆情分析技术(包括话题分类、情感分析等)来获取有助于决策的重要信息。比如2011年利比亚战争期间英国政府相关部门利用社交媒体来识别重要社交媒体平台和关键人物以便了解利比亚民众如何看待北约的干预并且每天都将信息整理成报告供决策部门参考。

三、大数据国际政治研究的分析层次

本文以实用性和理论性为标尺的两端将大数据国际政治研究划分为三个层次预测与辅助决策、微观理论和中层理论的研究以及以宏观理论为导向的研究。由此我们能够更清晰地厘清大数据在推动国际政治研究方面的作用。

()结合层次一:基于大数据的预测和决策系统

预测和决策是国际政治最重要的主题之一也是大数据与国际政治结合的第一个层次。其特点是一方面它具有较高的实用价值另一方面它的理论性较弱但并非完全没有理论色彩因为在对模型给出的预测结果进行解释时至少要以一定的国际政治理论和国际关系史方面的知识为基础。从既有文献来看在所有利用大数据进行国际问题研究的论文中以预测和决策为研讨目标的论文所占的比例高于其他类型所占的比例。

已有一些学者设计出基于新闻事件的预测模型。Chadefaux利用COW事件数据和Google News Archive提供的新闻事件在建立早期预警系统方面进行了尝试。作者首先证明如果关于紧张关系的新闻报道数量上升那么冲突更有可能发生因此新闻事件可以成为冲突预警信号。以此为依据作者建立了一个利用不断更新的新闻数据计算风险指数、预测在每个国家中冲突是否会发生并计算冲突发生的主观可能性的Logit模型。

Krummenacher的研究团队利用设在中亚、北高加索、巴尔干半岛等地区的LIN(local information networks)收集新闻事件并且在对新闻事件进行文本挖掘的基础上建立了FAST早期预警系统。该系统可以分辨多达186种事件类型从而帮助决策者能够了解冲突发展趋势识别危机以便及时制定应对策略。除了定量分析外,FAST系统还包括对单个国家潜在冲突的根源和影响因素所进行的定性分析。

在为外交决策提供辅助方面,LoweCBR(Case Based Reasoning)系统进行了深度探讨。CBR可以用于疾病诊断、设备故障检测等也可用来提供决策支持。它假设人们在进行决策时总是参考以前的案例因此,CBR首先根据每个事件所具有的多个特点进行编码然后利用最近邻元素法、结构映射引擎等算法来判断事件所归属的类别。如果现在要对一个将要发生的事件的结果进行预测就要把这个事件的相关信息按照编码方式输入到系统中然后系统就会给出预测结果。这个结果要么是在以往事件中与我们所关注的事件最相似的一个事件的结果要么是若干个相似事件的结果的众数。

还有一些作品虽然是以事件预测为主要目的但却更强调研究的基础认知性质。比如,Martinez等在利用行为模型预测恐怖组织行为方面做出了努力。他们指出尽管人们已经开发了一些模型用以预测行为SOMA(Stochastic Opponent Modeling Agents)CONVEX(Context Vectors)SitCAST(Situation Forecaster)但是这些方法均试图抽取以往事件的内在模式并通过计算新的事件与这些模式的相似度来进行预测。然而人类行为是富于变化的并不总是与以往的模式相符而以前的模型难以处理这类变化性。与这些关注相似性的模型不同作者及其团队设计的基于行为时间序列的CAPE算法(Change Analysis Predictive Engine)关注行为的变化性即行为体会在何时以何种方式改变其行为。以CAPE算法为基础的模型CAPE-Forecast能够综合CAPECONVEXSitCAST给出的结果并做出最终判断。作者利用五个恐怖组织在十年间的行为数据对这一算法进行了检验。

()结合层次二:微观理论和中层理论研究

在大数据与国际政治科学相结合的第二个层次上数据和模型被用来检验一些假设这些假设有时涉及一些并非立基于更高层次的理论之上的微观理论有时则涉及国际政治某个细分领域中的中层理论。这一结合层次的理论性显然要高于预测与辅助决策领域但其实用性却相对较低然而这并不妨碍通过研究而得到的洞察在得到进一步完善后可用于解决现实问题。

例如,Drury对影响美国总统有关经济制裁措施的因素进行了分析。利用自动编码的新闻事件和讲话文本作者发现首先当美国与别国的紧张程度增加时美国总统发起或扩大经济制裁的可能性会增加但当别国对美国的制裁行为表示出强烈敌意时美国会减小制裁力度。其次在信念方面美国总统的战略取向越偏向于合作一面他发起经济制裁的可能性就越低在制裁过程中总统越是相信自己有能力掌控事件的发展越可能会减小制裁力度。

再如,BaumZhukov利用文本挖掘技术对50个国家的1925份报纸中关于2011年利比亚事件和北约相关行动的102568条新闻进行了分析。他们发现报纸的所有权结构及其与其他报纸的联系网络会对涉及外交政策的报道产生影响。发行量较大、所有权结构较简单的报纸对利比亚事件报道得更多并且更偏好报道与军事相关的行动和决策同时对本国政府的政策持有更具批判性的态度。作者还指出相对于逮捕、暗杀等选择性的暴力行为报纸会更多地批评利比亚政府的非选择性暴力行为如空袭居民区等。

()结合层次三:宏观理论研究

在大数据与国际政治相结合的第三个层次上研究者或是试图检验一些对宏观理论来说至关重要的假设或是试图借助数据和模型来建立一套全新的理论。这一层次的结合更加适合于那些特别关注理论探索的研究者但其实用色彩却很少。

在国际政治理论领域现实主义、自由主义和建构主义的缺陷早已被人所知因此学术界又发展出英国学派、国际政治的前景理论、国际政治的女性主义理论等新的流派。然而无论是三大主义”,还是其他各类理论在资料收集、假设验证等方面都有不少缺陷。现实主义所讨论的国家实力通常都被简化成经济发展水平和军事实力建构主义关注行为体的观念但其依据通常只是官员讲话或少量官方文件。就此而论大数据却可以为国际政治理论研究带来新的工具和新的视野。例如现实主义者可以通过数以万计的变量来对国家进行描述并且利用这些变量并通过降维算法所得到的潜变量来对综合国力进行更精细的界定和分解。自由主义者可以借助海关大数据对科技快速发展和产业转型升级背景下政治关系与贸易关系之间的互动进行更深入的探讨这是因为与单纯的贸易量相比商品贸易结构等因素也许更能反映国际政治的结构性特征。建构主义者则可以利用文本挖掘技术来分析海量的官方文件和公众舆论信息研究生态环境与地区冲突的学者可以更好地对各地的不稳定因素进行监测等等。

在利用大数据进行理论建构方面已有一些学者作出了努力。Crooks等利用Twitter用户言论、联合国大会投票情况、武器转移数据对自2011年开始的叙利亚冲突进行了研究。借助社会网络分析技术作者发现除了由作为主体的国家所组成的自上而下的国家共同体和国际关系网络外还存在着一个基于各国公民的、通过对话题的讨论而形成的自下而上的共同体和网络二者呈现出相当不同的结构。作者对共同体的相似度进行了计算由参加联合国大会的各国组成的共同体1990年代的状态与21世纪初的状态相似度高达0.81(该值的范围为从01)而这一共同体冷战前的状态与冷战后的状态之间的相似度为0.55。这两个数据之间的差异是由苏联集团的解体和冷战后新的国家间关系的形成而造成的。不过由国家组成的共同体与基于公民的网络共同体之间的相似度仅为0.27

Baggott尝试结合大数据探讨相互感知中的不确定性在安全困境形成过程中的作用。他一方面利用反映相互感知的内部文件:1969-1981年中国的官方内部讨论资料以及美国FRUS(Foreign Relations of the United States)数据库中的文件他同时也利用《纽约时报》上报道双边外交事件的130万条新闻。借助回归模型作者发现与口头行为相比一方的实质行为给另一方的感知造成的影响更大与合作行为使对方产生的正向感知相比挑衅行为产生的负向感知更为明显。其次与中国对美国的态度相比当美国对中国的感知中存在不确定感时这种不确定感会导致美国对中国持更加积极友善的态度。可见不确定性在不同国家的外交评估中产生的效果是不同的。

四、大数据国际政治研究中的误区、挑战和建议

大数据为国际政治研究开辟了新的发展空间。在将大数据用于推动国际政治研究的过程中既要避免对大数据作出过等泛化的理解同时也应当正视并妥当处理研究过程中的各种挑战。大数据国际政治研究的推进也许比其他的研究方法更多地有赖于人们在创新合作模式、开掘数据资源等方面作出更大的努力。

()大数据国际政治研究的误区

当前一个不可忽视的误区是人们不愿或未能明确哪些研究议题归属于大数据国际政治研究。首先诸多科普类文章和媒体报道强调大数据指的是一种思维方式以及一种科研、经济和社会生活的发展趋势即重视对数据的收集、整合和利用。这种对大数据的界定主张人们不应过分关注数据集的大小而应关注如何让数据产生更多思想的或物质上的价值。然而正如本文开头的定义所强调无论是狭义上的还是广义上的大数据”,都强调数据量要足够大。以这样的标准来看在国际政治研究中有些量化分析文章只是使用了COWKOSIMO(Conflict Simulation Model)等传统事件数据库另一些使用了世界银行、Polity IV,以及统计年鉴的数据还有一些文章将多个数据库的资源投入到一项研究中以便借助数据间的内在关联而发现规律。按照本文对于大数据的界定由于所使用的数据的体量并不大这些研究尚难以被归类为基于大数据的研究。

其次被称为大数据的资料必须是可进行量化分析的资料或者虽然资料暂时无法被量化但至少收集资料的工作是以量化分析为最终目标的。仅仅收集海量的定性资料以完成信息分类、知识积累和知识分享而不进行量化分析或并不以量化分析为最终目的那么这些工作同样难以被归入大数据研究的范畴。例如在情报学领域用以辨别一个组织是否在开发生物武器的模型要求人们去搜集与设立试验区域、获取试验材料、运输战剂、运送动物、处理动物尸体等行为相关的信息。然而这一识别模型承担的主要是信息的整合、对比和拼接任务而并非是真正意义上的量化分析工作。因此也很难将这类情报分析看作是大数据研究。

再次我们还很难将直接用于具体业务的数据收集和分析行为视为大数据国际政治的关注点。与上文中提到的基于大数据的预测和决策系统(结合层次一)相比此类研究更加缺少学术价值。例如国家安全部门出于反恐需要对电话、邮件、网上聊天内容等进行监控以此来对恐怖分子的关系网络进行分析并安排相应的监控和抓捕行动。再如,Hisakawa尝试利用GIS(Geographic Information System)技术来识别高渗透性地区并进行边境管理。这两种应用所涉及的数据完全可以称为大数据这些与应用紧密结合的分析已超出国际政治的研究范围。尽管我们承认利用从监控过程中得到的信息可以分析恐怖分子在不同国家间来往的特点掌握更丰富的边境地理信息也有助于更好地进行外交决策———但这些分析毕竟都与最初的业务领域有较大的差异。这是应用衍生发展而非学术研究的拓展。实际上一些早已存在的基于海量数据的研究更适合被划入情报学、军事科学、地理学、金融学等领域而并不适合纳入大数据国际政治的研究议程。

()大数据国际政治研究的挑战

像其他数据密集型社会科学一样基于大数据的国际政治研究也需要应对诸多问题和挑战包括变量过多且存在自相关性以贝叶斯主义的方式解释频率主义的统计结果待验证假设超出了数据的统计强度等等。不过这一研究方向同时还有一些更为明显的缺陷。

首先国际政治领域中多数与大数据有关的文章都需依靠对新闻资料进行文本挖掘这对研究的科学性有不可忽视的影响。一是借以分析新闻文本的自然语言处理技术尚不成熟难以处理转折关系、因果关系等形式范畴和结构复杂的语句更不用说准确地理解比喻、夸张等修辞方法。二是在冲突发生时新闻报道的数量会急剧增加当局势平和时报道又会较少甚至消失。因此一些导致冲突升级的重要事件就会被遗漏。导致报道遗漏的另外一个原因是媒体倾向于只报道那些会引起广泛关注的事件。三是研究者利用新闻资料时往往假定在新闻事件中主体的行动能够反映其真实意图但事实上并非如此。同时新闻报道在话题、内容和数量方面也极易受到政府的干预。最后在对新闻报道进行赋值(比如文本挖掘时常用到的喜爱-厌恶值、冲突-合作值等)是对单个报道赋值还是应该对一个周期(比如一周)内的报道集合赋值还有待进行更深入的研究。一方面采用单篇报道的数值是不合理的因为一篇新闻报道不足以反映事件全貌。另一方面对报道集合赋值同样也不能令人满意。较之于两个国家在同一个星期内发生多次小规模武装冲突两国在一周内进行了一场激烈战斗的场景有所不同而以星期作为集合周期的话第一种场景的冲突程度数值却可能与第二种场景的数值是相等的。这种把多个不同事件简化成一个数值的做法无疑会对分析结果产生不可忽视的影响。这也是关注事件的性质和情境的国际政治研究者不愿意看到的。

其次大量基于大数据的政治模型都是为了对事件进行预测而开发出来的。然而模型能够被真正用于实际工作的可能性相对较低。一是在定性分析中人们往往凭借直觉和少数几个变量就可以做出非常准确的判断使用大数据和复杂的算法就是不必要的了。当然大数据技术对于决策者的最大吸引力在于它具有自动监测、自动处理数据和自动提示等功能。然而多数模型的自动化程度并没有达到这一水平就此而论大数据技术的吸引力也就大大降低了。第二多数国家都在异国设有使领馆、记者站等机构这些机构的工作人员会利用身处当地的优势和个人体悟对复杂的形势做出判断。这些判断或许要比模型给出的预测结果更加有价值。因此要说服外交决策者放弃这些信息来源转而去相信数据和机器的预测也是完全不可能的。第三人们仍普遍认为大数据科学更强调相关性而不是因果性。这种观点至少对国际政治来说完全是误导性的。相关性不但不能满足理论建构的需要也难以用于外交决策工作。显然就目前的发展水平而言大数据技术无法有效地分析政治体制的决策模式、国家长远战略的稳定性、偶然事件的微妙影响、威慑与实际行动之间的精巧平衡等重要因素在事件发展过程中所起的作用而涉及这些因素的因果关系却是决策者在实践中必须时刻考虑的。最后理想的情况是研究者把预测模型做成图形界面供并不精通大数据技术的人员使用更好地发挥模型的实用价值。但在现实的研究工作中设计成互动界面的模型毕竟只是少数。

再次在利用大数据进行预测时模型本身的缺陷使其能够产生的有效知识及其对决策的帮助有所伤害。众所周知模型在应对复杂多变因而无模式可循的情况时难以得到较高的准确性。即使是准确性很高的模型其价值也会受到质疑。以常用的Logistic回归为例假设我们要生成一个用来判断事件是否取真值的模型再假设在我们的样本中,97%的个案为非真值这意味着空模型的准确率高达97%。现在把大量变量放入模型中使准确率升到了98%,也就是说只使准确率上升了1%。但决策者在决定采用大数据技术之前必然思考是否为了这1%的提升而动用大量资源。同时模型生成的假阳性结果———无论是将公民误判为恐怖分子还是误判某个国家未来一年会发生叛乱———都可能会造成严重的决策失误和资源浪费。因为决策不仅仅是为得到分析结果而是还要根据分析结果调整应对策略并调配大量资源。现有模型在减少假阳性结果方面并不尽如人意。

()大数据国际政治研究的前景和相关建议

上述评价并非是一种悲观主义的价值立场相反要推动大数据国际政治研究的健康发展研究者需要在以下几个方向上作出更多的努力和尝试。

第一增加数据种类和数据来源。将大数据与国际政治研究相结合意味着研究者要把国际政治科学改造成一门数据密集型科学。这样一门科学包括收集数据、选取算法、分析计算结果、将研究成果转化成实际应用等环节。在学科的每个发展阶段都会有一个主导环节而其他环节都会围绕这个主导环节被建构和组织起来。在当前阶段大数据国际政治的主导环节还是数据发现和数据收集。尽管国际政治学者们已经使用过大量数据如前所述的COW事件数据、外事访问信息、联合国公开的统计数据等等但就它们的体量而言都难以被称为大数据。实际上目前大数据国际政治所能利用的大型数据集是非常有限的包括新闻报道库、社交媒体信息、官方文件集、地理数据、海关数据、一段较长历史时期的关系数据等。这些数据无法满足未来大数据国际政治研究的需要。因此研究者们需要寻找新的有价值数据及获取渠道。

第二倡导多种研究方法的联合运用。一方面基于大数据的研究需要借助其他研究方法来弥补自身在历史文化背景、国际政治理论等方面的短板以便更好地洞察问题解释数据和分析结果并将研究成果理论化。其他研究方法同时也需要利用定量研究在假设检验、理论与现实对接等方面的优势。因此研究者们应该注意在研究中同时使用定量分析、形式模型、思辩分析、案例分析、历史分析等多种研究方法。

第三致力于利用大数据及数据挖掘技术构建算法-数据客体。在进行理论研究时分类和概念化是一项重要的工作分类就是区分出一个待研究客体与另一个客体或者指出一个客体如何不同于其他客体而概念化就是对被分类的客体进行抽象界定。通过分类和概念化产生的术语很多都被用来指称理论依赖型客体比如物理学中的夸克、弦、平行宇宙等。在国际政治领域同样需要发现这样一些更为抽象的客体很显然像单极世界、两极世界、相互依赖这样的半理论化术语难以用来分析当前世界的复杂现象。借助海量数据以及聚类、因子分析、决策树等算法我们可以发现一些新的分类方式找到一些新的理论依赖型客体———或可称之为算法-数据客体。我们在量化分析中时常遇到的结构方程模型中的潜变量、判别分析中的判别函数、决策树输出的规则集等等均可看作是算法-数据客体。正如其他理论依赖型客体是存在的但却只有在特定的概念背景下才能被理解一样算法-数据客体也是存在的但却只有在明确所使用的算法和数据的前提下才真正具有意义。借助这些新概念研究者们可以超越目前仍然基本停留在机械论的理解方式中的国际政治理论。需要强调的是国际政治科学借助大数据来提高自身的实用价值具有一定合理性但是一味强调大数据在预测或外交辅助决策方面的应用对学科建设和发展来说却是不利的。相反如果国际政治研究有志于创造实用价值最好的办法也许是走某种迂回路线。也就是说要借助大数据开展基础研究发展新理论改变人们看待世界事务的视角。

第四研究者之间要建立新的合作模式。在数据密集型自然科学领域,Abbott早已指出在新的科研模式中创新将更加频繁创造知识和使用知识的人之间的关系将更加紧密科研合作机制也将发生改变。Hunt等人指出为了综合多个数据库的数据进行研究需要发挥云计算的优势。这又进一步要求应该在云发展有助于研究者和数据提供者进行合作的新方式。这些自然科学领域的建议也适用于国际政治科学。基于大数据的国际政治研究必然会强调各种研究要素的整合协调包括数据、计算基础设施以及统计学、数据库、国际政治传播学等方面的知识而多种研究方法的联合使用以及从数据到理论的抽象提炼过程进一步对合作效率与合作质量提出了更高要求。一种鼓励合作的研究进制应确保每个人的贡献都应在最后的成果中有所反映不满足这一标准的科研机制不太可能成为一种有效的机制。当前的学术评价和发表机制较难满足这一要求。最为明显的难处在于一方面基于大数据的研究对数据的体量、质量和多样性提出了更高要求仅仅是收集数据的工作就可能要耗费大量时间精力甚至还可能要以复杂的技术知识为基础另一方面在当前人们尚普遍强调论文的第一作者或者是唯一作者的情况下与执笔者相比为论文写作提供数据的学者贡献更难以得到充分承认。因此我们无疑需要制定出一些能够鼓励合作、能够更平等地反映每个人贡献的发表机制、科研机制和确认机制。建立了这样的机制合作研究将会更加普遍也会有更多的资源、更多的创造力和想象力被吸引到这一领域中。

第五加强大数据国际政治的可视化展示。目前已有一些作品在冲突分析的可视化方面做出了努力。比如,Stahl在分析与水资源相关的国际关系史时在世界地图上对从聚类和决策树模型中得出的结果进行了可视化。在此数据可视化并不只是一种为研究者提供方便的工具。一方面随着大数据技术的引入国际政治研究的专业性相应增加研究者们同时也应更积极地以生动、易理解的方式展示和宣传研究成果从而使更多人对国际政治产生兴趣甚至踏入这一学术领域。在这方面利用数据可视化技术制作内容丰富、可看性强的图表无疑是非常有益的。