数据采集小作业-(9)基于R语言爬取BOSS网站招聘信息
作者:王堃
指导教师:王文武
单位:曲阜师范大学 统计学院
在众多数据科学与网络技术中,人们对于爬虫的兴趣不断高涨。作为网络爬虫的两个有力工具:R和Python,在选择上已知饱受争议。本文主要介绍通过R语言实现网络爬虫。首先,第一部分简要介绍了Python和R两种爬虫工具的特点及选择。然后,在第二部分杰少Hadley等人开发的rvest包及相关函数的用法。最后,在第三部分机型实例操作,结合stringr包爬去BOSS直聘网北京地区数据分析师的招聘信息。其中,后两部分室本文的重点,对于理解和实现R语言爬虫十分重要。
具体研究见附件。
王堃-基于R语言爬取BOSS网招聘信息.pdf