智库概念界定和评价排名：亟待探求的命题_智库_爱国

一、智库界定：难以完成的命题

在过去的十年里，多个机构或出版商对智库进行国家层面的评价排名。如2014年1月22日，宾夕法尼亚“智库和公民社会”项目发布最新版本的“全球智库报告”。这个起始于2007年的年度系列报告饱受智库研究学者或智库成员的质疑和批评。名列榜首的智库热衷于在推广媒介和他们的网站上炫耀其领先地位，这些评价排名有助于将公众的注意力吸引至全球范围的智库发展，因此也倍受欢迎。但是目前的评价排名存在着令人担忧的问题，尤其普遍的是智库概念界定含糊不清和评价排名方法论缺陷等问题。因此，我们应该对现有的评价排名持谨慎态度。

智库内涵丰富导致其概念的模糊性。日本智库研究专家Takahiro Suzuki对智库做出过一个非常精练的界定：“智库是从事公共政策研究的机构”。[1]智库研究领域知名专家斯通（Diane Stone）则将智库视为“相对独立于政府、政党和压力集团，从事当下政策议题研究和分析的机构”[2]；在政治科学百科全书中，拉迪（Stella Ladi）将智库描述为“有别于政府机构的，致力于运用专业知识和网络活动为多元政策议题提供建议的研究机构”[3]；瑞奇（Andrew Rich）基于美国视角将智库界定为“独立的、中立的、非营利性的，以专业知识和思想观点产出为基础获得资助并影响政策过程的研究机构”。[4]对于以上学者的界定，我们可以断定他们在有意进行特别的选择和概念化的限定。关键在于一个特定的概念将会放大或缩小判定智库的范围。例如：在Suzuki和拉迪的界定下，一个隶属于政党的政策机构会被认定为智库，而在斯通和瑞奇的界定下，就不会这么认为。

更为广泛的是，我们注意到，概念界定中智库属性的数量和该概念涵盖的机构数量之间成反比关系。比如：在一个智库概念界定中，出现的属性越多，符合这一概念的智库就越少；同时也可以发现：概念界定中的一些属性本身存在问题，他们看起来并非不证自明。就智库而言，诸如“独立性”的属性就存在着多种解释：既可以是财务上的独立性，也可以是机构运作的独立性，甚至可以是思想上的独立性。在财务独立性的维度，我们可以调查智库的资助模式来判定给定的智库是否独立；在机构运作的独立性方面，我们可以考察组织的隶属关系；思想独立性方面，蕴含在智库提供的政策建议中的思想观点或者意识形态，同样可以用来判定智库的独立性。而且，对于“独立性”的评价同样因国家的不同而表现出差异性。比如：一个美国的评论者可能将一个以国家资助为主的智库视为非独立的，但是一个来自西欧的评论家可能在一定程度上或者至少可能将其视为绝对符合独立性的标准。总之，智库的概念界定存在模棱两可和含糊不清的问题。

因此，智库概念界定面临的挑战在于既要尽可能的简化又要尽力涵盖智库必须的属性，同时也需要足够的精准以便能够划清智库和非智库组织机构的界限。置于跨国智库分析的情境，笔者将智库界定为：以政策研究和政策分析为基础，以影响公共政策（有时也包括公司事务）为目标的研究机构。这样的界定暗含了智库来源的多元性，反映了特定情境下智库的运作环境（外生因素）和具体到特定机构的内部运作（内生因素）下智库的以下特征：

（1）不同的规模；

（2）独立运作或与政府部门、基金会、大学、政党等机构保持业务联系；

（3）雇员制，不同比例的、不同类型专长的职员结构（包括研究人员、政策研究专家、前政府高官等）；

（4）专注于特定政策领域或者限定于某个范围的较为宽泛的政策领域；

（5）多元化的资助体系，包括公共资助、私人捐赠、会费、具体项目的委托资助等；

（6）通过不同的活动致力于影响公共政策，这些活动包括：出版政策相关论文和简报、组织或参与政策相关的论坛或网络活动、提供政策评价、在不同类型的会议上为立法机构或政府部门的政策制定者提交听证报告或政策建议、接受媒体采访、政府换届后为政府部门提供短期借调或长期供职的人才。

智库产出的供给和需求影响着智库发展、特征及其在国家制度下的工作方式习惯。这些因素包含在不同的政治体制中，政治制度、政治传统、管制环境、不同类型的资助体系、人才市场政策下的职业选择、公民社会发展等。[5][6]但是，显而易见的是就像存在于全球及世界不同区域间的多元性一样，这些因素并非按照同样的轨迹运转。为了更好地理解智库的运作机理，我们既要远景式考察国家层面的智库体系或特定政策领域层面的智库运转，也要近景式地观察某一智库个体的运作情况。比如Boucher和Missiroli、Ioannides关于欧洲智库对欧盟政策议题的细致的研究[7][8]；Thunert关于德国智库的整体研究[9]；Wiarda关于美国外交政策研究中心的深度研究。[10]以此推理，结合案例研究，Tom Medvetz建议将智库界定为“介于学术界、政界、商界和传媒界之间的混合型组织”。[11]学术界和政界分别为智库提供学术权威和政治权威、商界为智库提供经费资助，传媒界为智库提供政策观点与政策制定者之间的通道。智库旨在拉近或者填补这些领域之间的缝隙，同时也需要与其保持适当距离，以保证和巩固作为智库应有的鉴别力。因此，智库的运转表现为“谨慎的平衡行动”[12][13]这一行动在不同的时空逐渐演进出其差异性。

讨论至此，关于智库概念界定，我们应该有一个清醒的认识：即使限制在特定国家的情境下，对智库做出详尽而宽泛的界定都是非常困难的，如果置于跨国情境下考察，将会更加复杂。尽管如此，一些知名的全球智库评价排名仍将其作为力求实现的目标。在下面的部分，笔者要考察的是自2007年由宾夕法尼亚大学“智库和公民社会项目”发起并实施全球智库报告（GGTTT），及其在全球智库评价排名中存在的一些概念化和方法论问题。

二、全球智库排名：运作方式和失败原因

评价排名是保持组织有效产出的必需工具，至少评价具有如此功效。但是，即便公平而明确的评价，也不免陷入无休止的争论。这些评价排名基于或多或少的硬性指标，而更多是采用主观性评价指标。在包括公共讨论在内的社会科学研究领域，我们更多的倾向于基于硬性指标的评价排名（这并不意味着我们对基于主观评价指标不感兴趣，只不过考虑到政治家们对全球智库评价排名的普遍的或个别的认识）。全球智库报告展示出了其“打造全球智库评价排名领先地位”所做的努力。[14]这个报告的确有助于将公众的目光吸引至“智库”——这类提供以学术研究为基础的政策建议为主业的组织。James Mcgann 和他的团队成员将全球智库的数量锁定为来自182个国家的6603家智库，虽然这一数字已经很高，大多数学者也都认同美国、中国、英国、印度、德国等国家的智库居多，甚至从国家智库数量上也是这个排序。尽管全球智库报告中对智库的冗长的界定自2007年以来在逐步改进。但是，关于全球和国家层面智库的数量，不得不引起人们的疑问：当全球智库排名的组织者试图识别全球范围的智库时，到底在多大程度使用它们自己对智库所做的界定。比如拿到2012年排名“入场券”的智库，包括：赦免国际、透明国际和人权观察三个全球性倡议集团；世界经济论坛（一个国际合作组织）；“马克斯·普朗克研究院”（即：马克斯·普朗克科学促进会，一个为德国80多家前沿基础研究机构服务的学会组织）；美国国家民主捐赠基金和开放社会研究所（两个基金会组织）。同时，怎么让我们真的相信：2012年阿根廷有137家智库、南非86家智库、罗马尼亚54家智库、肯尼亚53家智库、玻利维亚51家智库、多米尼亚共和国28家智库。因此，正如大多数现有关于美国组织研究的文献处理方法一样，智库研究文献中任何试图超越这一偏见的努力都是值得鼓励的。

但是，重要的是，该全球智库评价排名的表面价值不应被高估。组织者开诚布公地承认其本身存在的一些偏见和异议：比如可能没有展示出诸如非洲和亚洲某些区域的智库，尽管在近年来的评价排名过程中，他们尝试通过提名推荐的“民主化”方法来解决这一问题。也就是，首先允许来自所有6603家智库同行、3500名记者、公私捐赠者和有选择性的政策制定者提名现有38个排名类别中的25个智库（自我提名是不被允许的）；在第二轮，相同的投票者对第一轮中获得五票及以上的智库进行评价排名，他们有权决定参评的智库能够进入到现存中任一类别中的数量（自我排名是不允许的），然后这一结果由若干个智库研究专家和来自不同区域的专家负责审查可能存在的任何错误，无论是一般的翻译拼写错误或是严重的疏漏；第三轮评审中，相同的专家评审团队有权确定最终的排名，并为任何可能的改变负责，然后提供给智库评价排名的组织者，由其准备并将最终的排名付诸出版。每年年初经过这一程序，我们将得到基于全球视野、地区研究或者其他一些标准下的名列榜单的“顶尖智库”。但是，经过这一的评审程序，我们真的得到（智库排名）了吗?

非常不幸的是这些排名存在着严重的问题。当我们对智库进行评价排名时，首要的是采取明确的标准。比如，如果一个智库在类别A或类别B中排名或高于或低于其他智库，我们应该知道为什么。尽管这一指标对于评价排名的组织者而言是通用的评价标准，但对于全球智库评价排名的参与评审者却是一个冗长的评价指标体系，这一评价指标体系包括“影响决策者、媒体和学术界精英的渠道”、“作为决策咨询者的职员数量”、“智库学者所获的奖项”、“成功突破政策制定者传统思维或者产出创新政策观点和项目的梳理”等指标。而大多数所列出的指标对于衡量智库绩效的效用存在较大争议，并且关于如何把控这些指标，评审专家仅仅获得微乎其微的指导。即便这样，我们还要求他们从数量众多的、彼此之间存在内在关联的“资源类指标”、“效用类指标”、“产出类指标”和“影响类指标”中鉴别出其不同。

因此，无论评审者的评审程序多么理想，无论这些评审者是普通提名者还是专家组成员，他们能否较好地运用这些多元的评价标准和指标体系，是智库评价排名的关键问题所在。参与评审的专家们大多事务繁忙，也不能寄希望于雇佣一个拥有精通计算能力的研究助手帮助他们的评价。几乎可以确定的是，绝大多数评审专家会以某种“捷径”的方式开展他们的评价，或投票给有私人联系的智库，或关注那些知名的、有长期威望的智库，显然如此评价是主观的。同时，知名度和成功地将观点转化为政策并不能划等号。因此，尽管这些排名的标准选择和指标设计给人的印象看似严谨，但在实际操作中，基本依靠直观感知而非理性分析。[15]智库评价排名的方法论缺陷，自然会出现这样的结果。

总之，全球智库评价排名受困于一系列严重的且难以修复的问题。[16]更进一步讲，在各国智库运作环境存在着巨大差异的情境下，开展全球智库评价排名或者区域性智库评价排名的价值何在?如同Mendizabal 指出的“除非拥有通行的行动领域的特征可以运用，跨越整个大陆的对比毫无考察的价值”。排名前列的智库热衷于利用其优势地位并巩固之（不仅仅获得资助），诸如此类的排名导致智库开始倾向投注更多的精力和资金用于公共关系，而不是其核心业务——政策研究。[17]如果专门考察智库在特定国家和其他情境下的政策影响力，也许我们可以获得更有价值的评价排名。以下就展开对这一问题的分析。

三、智库影响力评价：以产出为指标及其局限

智库是否具有影响力，如果可能的话如何衡量其影响，这些问题经常被提及。[18][19]勇于涉足这一问题的回应者提供的答案各不相同。这种差异性显然基于不同的理论渊源和提出问题的倾向性。权力精英理论的拥趸者认为智库能够并且可以发挥影响力，因为他们属于统治精英的一部分。新马克思主义者则从葛兰西学派的“话语霸权”理论出发，认为智库有助于形成和掌控国际政治经济的话语霸权。多元主义理论者则将智库视为政策思想市场的重要供给者。当然智库自身也倾向于夸大其在政策过程中的影响力，“承诺式宣称”的动机在于向资助者证明其价值。[20]像Murray Weidenbaum指出的，“一定程度的吹嘘是智库个体理性且必然的选择”。[21]虽然大多数观察者都接受了Weidenbaum对不同类型、不同领域、不同时期智库的影响力评价，但是这就催生出关于“智库影响力”构成的问题。Rich为此提供了一个答案，他将影响力界定为“专家成功地使其工作为人所知并对一系列政策制定者产生影响，以影响决策者的思维或使公众明辨政策相关信息”。[22]对此的理解，我们当然不能忽略智库仅仅为已经记录下来的政策讨论和已经实施的政策决策提供“智力合法性”的解释的可能性，尤其在所谓的“评论转换期”[23]，比如大选后的政府重组或者现行理论范式遭遇现实实践的挑战或者政府需要履行新的角色，所有这些都为智库打开了影响政策过程的机会窗口。

无论是议程设置阶段还是政策审议阶段，追踪智库在政策过程中的真正影响力，在现实实践中都是非常复杂的。即便是评价名列榜首的智库在政策过程中的作用，都难以获得政策制定者的官方认定。尽管叙事分析有助于更好地理解政策制定过程，但也通常难以对智库介入的动态性进行全面的概括。因此，判定智库在政策过程中可能的影响力，需要对具体政策过程的案例式追踪。但是，政策过程的案例式追踪，面临着方法论层面和其他原因的困境。例如，政策过程案例式追踪需要耗费时日，智库的原创性观点哪怕仅仅转化为法律条文中的个别概念或者政府的行动，甚至都需要追踪数十年的时间。并且智库观点向政策转化的过程通常需要许多的支持，至少是参与者宣称的支持，但是一旦失败（如政府没有采取行动），通常是个意外，当然也不再被讨论了。[24]这自然会产生以下相互关联的问题，即政策输入是多元的，公共政策或政府政策演进是一个复杂的、迭加反复的过程。在这一过程中包含了对政策观点的研究、分析、讨论和提炼，经常需要和众多利益相关群体广泛征询意见。当一个政策最终被采纳，它可能带有众多手指留下的印记。[25]政策过程追踪通常是一项耗时很大的活动，需要将千辛万苦获得的只言片语汇总起来，作为有效的证据，对智库产出做出看似合理的解释。但是，学者们关注的似乎就是试图否认对智库产出的不同解释，这样的情况是不可能完全避免的。

这就难怪获取和评价智库影响力通常依赖于数量众多的指标和易于获取的数据。比如，政策过程中的“投入”可以测量政策报告和智库相关议题简报的数量，还包括智库提供给立法机构和政府部门的口头报告和书面建议，也可能去测量智库组织的或者智库成员参与的政策相关的活动数量以及媒体在这些活动中的参与情况，比如，非营利组织“公平精确报道”（美国媒介监督组织）提供的美国智库排名报告，就是以媒体对智库产出的引用情况进行，还包括诸如智库成员借调到政府机构的情况等等。[26]在相关的领域，Julia Clark和David Roodman近来尝试测量美国智库和智库国际化发展的公众宣传活动情况，并主要测量以下五个指标：（1）社交媒体粉丝的数量（即脸谱和推特的追随者）；（2）相关的全球网站流量排名；（3）智库被友情链接的数量；（4）智库被相关全球新闻提及的数量（多语种）；（5）谷歌学术搜索的引用数量。[27]为了更好地获取智库效能，他们还基于预算数量对结果进行了调整。尽管Clark和Roodman已经意识到如此测量在方法论层面存在的缺陷和排名操作过程中的常见局限，但他们还是展示出来其超越简单感知型排名的优越性。另一个例子是，2001年以来英国《瞭望》杂志一直探索的定性分析路径，主要通过采用专家组的评审决定年度智库奖项。显而易见，对智库进行完美的评价是不可能的，这本身也预示出其可以改进的空间。

但是，作为一个总结而言，数量众多的指标仅仅有助于观测到智库及其成员产出结果或知名度，也就是Weidenbaum所说的“数量众多的指标可以用来测评智库提供的中介产品”。[28]但是无论从个人还是智库整体层面的，这些指标都很少涉及智库对政策过程的真实影响，政策制定者是否实际地运用这些中介产品值得探讨。比如，以智库声誉为基础的数据，也就是通过对政策制定者的问卷调查所获得的对智库及其专家团队的评价，能够用来获取智库的影响。再者而言，这些数据更多的来自于感知，较少涉及智库对政策过程的真实影响，并且确立这些数据和其他数据相关性的可信度是非常困难的。尝试分析声誉数据和学术期刊出版物和媒体传播数据相关性的研究，可见近期德国全国性日报《法兰克福汇报》发布的德国“最有影响力经济学家”和他们供职的机构排名；《韩国经济日报》基于“公众影响力”、“研究报告的质量”、“研究人员的竞争力”和“研究机构的规模”等指标的韩国智库排名，这些排名均引起大量方法论层面的质疑。照此分析，对智库影响力进行评价排名在实施层面存在较大的问题，更不用说是跨国层面的。

四、结论：谨慎看待智库排名

本文意在警示读者现行智库评价存在的诸多问题和挑战。尽管目前的智库排名不甚完美，但也不能简单地将其完全否定。智库排名因很多原因仍将保持其吸引力。它们满足了我们对智库绩效评价的好奇心，甚至也可以帮助我们确立智库成功运作的标杆，同时也可以提升政府和机构的政策水平。因此，智库排名将会持续，我们需要做的是，当我们阅读和使用时这些排名时应该持谨慎态度。进一步而言，审视现有的智库排名，我们应该有意识地以其对智库的概念界定和评价排名的方法论为基础，分析其相对局限性。尤其是我们不能误解合理且严谨的感知型排名。但是如果我们采取必需的谨慎态度实施智库评价排名，我们就能够以负责任的态度享受这一过程。

参考文献：

[1]Takahiro Suzuki.Think Tanks and Policy Formation in Japan.http://www.tt2005.jp/modules/overview/index.php?id=17>.

[2]Diane Stone.Think Tanks,in Neil J.Smelser and Paul B.Baltes eds.International Encyclopedia of the Social & Behavioral Sciences.Oxford:Elsevier,2001.pp15668-15671.

[3] Stella Ladi.Think Tanks,in Bertrand Badie,Dirk Berg-Schlosser and Leonardo Morlino eds.International Encyclopedia of Political Science.Thousand Oaks:Sage,2011.pp2608-2611.

[4][22]Andrew Rich.Think Tanks,Public Policy,and the Politics of Expertise.Cambridge:Cambridge University Press,2011.

[5][20][23]Diane Stone.Introduction:Think Tanks,Policy Advice and Governance,in Diane Stone and Andrew Denham eds.Think Tank Traditions:Policy Research and the Politics of Ideas.Manchester:Manchester University Press,2004.pp1-16.

[6]Stone,Diane.Think Tanks and Policy Advice in Countries in Transition.in Toru Hashimoto,et al.eds.Public Policy Research and Training in Vietnam.Tokyo:Asia Development Institute,2005.pp38-109.

[7]Boucher,Stephen.Europe and its Think Tanks:A Promise to Be Fulfilled.Paris:Notre Europe,2004.

[8]Antonio Missiroli,Isabelle Ioannides.European Think Tanks and the EU.Berlaymont Paper,2012（2）.

[9]Martin Thunert.Think Tanks in Germany:Their Resources,Strategies and Potential.Zeitschrift für Politikberatung 1,2008（1）:32-52.

[10]Howard J.Wiarda.Think Tanks and Foreign Policy.Lanham:Lexington Books,2010.

[11][12] Tom Medvetz.Think Tanks as an Emergent Field.Social Science Research Council,2008.

[13]Tom Medvetz.Think Tanks in America,Chicago and London:University of Chicago Press.2012.

[14]James G.McGann.2012 Global Go To Think Tanks Report and Policy Advice,2013,January.http://repository.upenn.edu/cgi/viewcontent.Cicatricle=1006&context=think-tank’s.

[15][17]Enrique Mendizabal.This Year,Instead of Ranking Think Tanks Let Think about Them More Carefully,2012.

[16]Goran Buldioski.Mirror,Mirror on the Wall…Tell Me Who is the Best Think Tank in the World?,2011.http://goranspolicy.com/mirror-mirror-wall-tank-world/.

[18]Donald E.Abelson.Do Think Tanks Matter? （second edition）.Montreal and Kingston:McGill-Queen’s University Press,2010.

[19][21][24][28]Murray Weidenbaum.Measuring the Influence of Think Tanks.Society,2010,47（2）:34-137.

[25][26]Kuntz,Fred.Communications and Impact Metrics for Think Tanks,Centre for International Governance Innovation,2013.http://www.cigionline.org/blogs/tank-treads/communications-and-impact-metrics-think-tanks.

[27]Clark,Julia and David Roodman .Measuring Think Tank Performance:An Index of Public Profile,CGD Policy Paper 025,2013.Washington:Center for Global Development.http://www.cgdev.org/publication/metrics-think-tank-profile.

注：

英文原文略。

快好知 kuaihz

智库概念界定和评价排名：亟待探求的命题

民企的危急时刻与改革方向

中巴经济走廊：当前争论与前景思考

“十三五”时期环境保护面临八大挑...

最新