快好知 kuaihz

基于AI语言模型测度美国对华政治态度

中美关系是当今世界最重要和最复杂的双边关系,甚至决定了未来几十年的世界经济走势(Foreign Affairs, 2022)。但现有对中美问题方面的文献仍然集中在使用分析事件数据的测算方法(Caliendo & Parro, 2022;Fajgelbaum & Khandelwal, 2021;阎学通和周方银,2004) 。但现有指数主要针对中美双边重大事件进行分析,并未系统性对中美双边关系进行高频结构性量化。国会作为美国政策决策机构的关键一环,其提案文本对于研究美国对外政策具体较强的研究价值。本数据库将以美国对华提案文本作为研究对象,测度美国对华政治态度。

一、数据库指标构建

1.1 构建思路

文章数据库构建思路如图1所示,其中共包括7项步骤。

(1) 爬虫获取文本数据(共2958个提案,共3756万词)。

(2) 抓取关于中国(定位词为“China”或“Chinese”)句子,对句子进行BERT模型情感分析,在提案层面对每句包含“中国”的语句BERT模型得分进行加总。

(3)随机抽取600个提案,人工阅读后打正负向标签,计算发现BERT预训练模型准确率为72.76%。

(4) 再次抓取每个提案对台湾、香港、西藏、新疆的态度,并以此作为特征值,分别利用450个提案标签和Catboost模型进行监督学习,得到经过监督学习矫正后的美国对华政治态度。

(5)得到各提案最终美国对华态度,最终交叉验证预测准确率达86.11%。

(6)根据议员信息,将各提案在时间、党派、主题层面进行加总。

(7)根据人工标记的提案主题,再次对提案文本进行监督学习,明确美国对华提案的主题。

使用BERT模型的好处有以下两点:

(1)分析文本大数据,更加全面可信。文章涉及的提案文本共3756万词,正如基辛格所说:“重大的提案往往长达上千页,客气地说,能仔细将其读完一遍的议员真是凤毛麟角”(基辛格,2015),而采用BERT模型机器学习可以快速的阅读完涉华提案的每一句话,相比以往的仅仅针对个别涉华提案的分析,本数据库对所有涉华提案逐句进行分析,结果更加全面可信。

(2)相对客观准确。BERT模型是由GOOGLE研究院基于33亿文本语料研发的预训练语言模型,其可以通过上下文精准判断文章语义。既有文献普遍采用情感词典进行情感分析,相比传统情感词典方法,采用BERT语言模型进行以下几点优势。

第一,上下文理解能力更强,传统文本词典方法通常只考虑词汇本身的情感倾向,而没有考虑上下文的影响。而BERT模型通过预训练模型学习到了丰富的上下文信息,可以更好地理解词汇在不同语境下的情感倾向。

第二,自适应性更强,传统文本词典方法需要手动构建词汇情感词典,这种方法需要人工成本高,而且难以处理新词、多义词等问题。而BERT模型是基于数据驱动的方法,可以自适应地学习到新的语境和情感词汇。

第三,精度更高,相对于传统文本词典方法,BERT模型在情感分析任务中通常具有更高的准确性和泛化能力,尤其是在处理复杂的语言现象、多层次的语义结构和文本噪声方面。

图1 数据库构建思路图

1.2 模型方法介绍

文章主要用到Bert模型和Catboost两种模型。BERT模型是2018年10月由Google AI研究院提出的一种预训练模型。BERT的全称是Bidirectional Encoder Representation from Transformers。BERT在机器阅读理解顶级水平测试SQuAD1.1中表现出惊人的成绩: 全部两个衡量指标上全面超越人类,并且在11种不同NLP测试中创出SOTA表现,包括将GLUE基准推高至80.4% (绝对改进7.6%),MultiNLI准确度达到86.7% (绝对改进5.6%),成为NLP发展史上的里程碑式的模型成就。它是基于33亿文本的语料上预训练语言模型。

Catboost模型是一种基于树的集成方法,是一个预测率破多项记录的模型。“Cat”是 categorical的缩写,与其他预测模型相比,CatBoost 的最大优势在于直接处理分类变量,CatBoost的这一特性使其成为文章针对分类问题求解预测的理想选择。其他方法将分类变量转换为数值变量较为不方便,而使用CatBoost只需定义分类参数,然后调整超参数即可处理这些分类特征。

1.3 模型语句示例

文章尝试使用BERT模型,分别选取美国对华特别正向、比较正向、比较负向和特别负向四种态度的四种语句作为例子,展示BERT模型的结果。首先是BERT模型认定正向态度为1的语句为:Whereas since the normalization of bilateral relations between the United States and the People‘s Republic of China in the 1970s, the United States has shown good will to the People’s Republic of China by focusing on expansion of bilateral trade while deferring discussions of repayment of the People’s Republic of China ‘s defaulted national debt.该语句来自H.Con.Res. 110提案文本。

第二,BERT模型认定正向态度为0.5的语句为:China’s Premier, Wen Jiabao, has committed to rectify this serious imbalance by increasing China’s imports of goods and services from the United States.该语句来自H.Con.Res. 72提案。

第三,BERT模型认定为负向态度为-0.5的语句为The government of the People""""""""s Republic of China refuses to renounce the use of force against Taiwan. 该语句来自H.Con.Res. 462提案。第四,BERT模型人认为负向态度为-1的语句为“Whereas the government of the People""""""""s Republic of China covered up the outbreak of the coronavirus disease 2019 (commonly referred to as "covid-19") during its early stages, resulting in a global pandemic and more than $2,000,000,000,000 in financial damage to the United States.”该提案来自H.Con.Res. 110。

二、数据库结果呈现

依照以上方法,我们首先根据美国对华提案文本测度的政治态度,在年度层面上进行加总,并绘制了美国对华政治态度在年度层面变化图。可以发现,美国对华政治态度在2001年-2002年之间随着中国入世,中美关系逐渐好转,但随着“台独”问题的不断发酵,美国对华态度遭到了较大程度的滑坡。在2005年之后,随着中美双边领导人的沟通加强,美国对华态度逐渐好转。尤其是在2007年美国金融危机之后,两国领导人在货币政策协调、全球经济复苏等一系列问题上达成一致,双边关系开始好转。2010年之后,美国对华态度小幅下降后整体趋于稳定,直到2016年及之后,美国对华态度开始陡然下降,并在2020年和2021年达到最低点。但在 2022年,美国对华态度有所回升。

数据来源:美国国会提案文本及作者分析

图2 美国对华政治态度年度变化图

图3将美国对华政治态度在季度层面进行加总,我们可以观察到美国对华态度的更细致变化。可以发现相比美国年度对华态度的变化,每季度对华态度波动增加,这种波动加大尤其是在2005,2008,2016,2019,2020等选举年份或前后变化较大。这也说明美国国会在选举关键年份对华态度出现了较大幅度的不确定性。

数据来源:美国国会提案文本及作者分析

图3 美国对华政治态度季度变化图

最后,如图4所示,我们将各提案计算的美国对华态度在日度层面进行加总,可以发现,尤其在美国对华态度出现明显恶化的2005, 2008, 2015, 2019, 2020等年份,美国对华态度在日度层面出现较大幅度波动。与此同时,日度层面的高频数据也揭示了,美国对华态度在越负面时,其分化也越加严重,即使在美国对华态度最差的2020年和2021年,美国也存在着对华中立甚至正面提案。针对这一分化趋势,我们进一步分别从党派和主题两方面对其进一步分析。

数据来源:美国国会提案文本及作者分析

图4 美国对华政治态度日度变化图

三、美国对华政治态度的分化

下图5分别测度了美国共和党和民主党对华政治态度的分化,其中虚线绘制了共和党议员提出对华提案的政治态度,以此来代表共和党对华政治态度;实线绘制了民主党议员提出对华提案的政治态度,以此来代表民主党对华政治态度。可以发现,民主党议员对华态度相对较为稳定,共和党议员对华态度相对较为激进,尤其是近年来议员对华态度恶化,也主要集中在共和党对华态度恶化,而民主党对华态度的波动幅度却不大。这一描述性特征打破了既往认为“两党态度一致反华”的种种论断。

图5 美国对华政治态度分化

下图6和图7描述了美国对华各个主题的提案态度。文章将所有提案分为文化、经济、军事、医药、科学、技术等主题分类。从图6中可以发现,美国对华在经济类提案态度相对较为温和,在“人权”和文化等主题方面对华态度较为激进。图7中可以发现,美国对华在科学和医药类提案对华较为温和,但在技术类对华提案较为激进。这也说明,中国与美国在经济、基础科学、医疗等领域仍然有合作空间,但是对于文化、技术等领域也要注意美国对华的政策打压。

图6 各主题分类下美国对华政治态度

图7 各主题分类下美国对华政治态度

四、美国对其他国家的政治态度

为了探究美国对其他国家的政治态度,与中国的政治态度进行对比,文章还同样采取BERT模型和美国涉及其他国家的提案文本进行分析。文章测度了美国对其他八个国家,其中包括,四个与美关系友好国家(澳大利亚、日本、英国和韩国),四个与美关系紧张国家(伊朗、古巴、朝鲜和俄罗斯)。图8列示了美国对四个盟国的态度变化。可以发现,与美国友好国家政治态度大多为正,且指数也能补助到双边关系中的大事件(比如2019年英国脱欧和北爱尔兰问题上的分歧等)。图9列示了美国对四个敌对国家的态度变化。与美国关系紧张的国家,美国对其政治态度普遍为负,并且也能捕捉到近年来的重大事件发生(比如2022年俄乌冲突发生后,美国对俄罗斯政治态度急剧下降)。

值得注意的是,尤其是2019年以来,美国近年来对盟友和敌对国家的态度均在改善。而图9中的变化图也显示,美国近年来除对俄罗斯之外,对其他传统敌对国的态度开始缓解。事实上,近年来美国在缓解其他敌对国家的态度也采取了诸多措施。比如2021年,美国总统拜登表示,他愿意恢复与伊朗的外交关系,并解除一些制裁措施,以便恢复伊核协议。又比如,2021年拜登政府也曾表示,他们愿意与朝鲜进行外交谈判,并寻求通过外交途径改善与朝关系。图8和图9说明了美国近年来正在寻求修复盟友和传统敌对国的关系,这与图1美国对华政治态度的急剧下降形成鲜明对比。

五、结语

文章采用BERT模型和Catboost模型,基于美国对华提案文本,测算了美国对华政治态度。指标发现,美国对华政治态度自2016年及之后,美国总统上台后美国对华态度开始陡然下降,并在2020年和2021年达到最低点,而在2022年期间,美国对华态度有所回升。美国国会在选举关键年份对华态度出现了较大幅度的不确定性。共和党和民主党对华政治态度存在分化,民主党议员对华态度相对较为稳定,共和党议员对华态度相对较为激进,尤其是近年来议员对华态度恶化,也主要集中在共和党对华态度恶化。中国与美国在经济、基础科学、医疗等领域仍然有合作空间,但是对于文化、技术等领域也要注意美国对华的政策打压。美国近年来正在寻求修复盟友和传统敌对国的关系,这与美国对华政治态度的急剧下降形成鲜明对比。

本站资源来自互联网,仅供学习,如有侵权,请通知删除,敬请谅解!
搜索建议:测度  测度词条  美国  美国词条  对华  对华词条  模型  模型词条  态度  态度词条