作者:付悦
指导教师:王文武
单位:曲阜师范大学 统计学院
随着科技的发展,人们对于数据的兴趣越来越高,数据的分析和处理也逐渐变成了人们研究的重点。在处理数据之前,自动爬取数据是进行数据分析的一个很重要的前提。本文主要基于R软件,以猫眼数据TOP100的电影为依托,通过爬取目录页与详情页的信息,介绍爬取数据的详细过程;并在爬取数据之后,对所爬取的数据进行简单的数据可视化处理以加深对于所爬取数据的理解。最后,本文对整体进行了一个总结与概括,这对于我们理解R语言爬虫有着重要的意义。
具体研究见附件。
付悦-从猫眼电影TOP100看数据采集.pdf