一、以搜索引擎爬虫的身份访问网页
在线文档平台为了让文档内容被搜索引擎收录,一般展示给搜索引擎和普通用户的界面会不一样,展示给搜索引擎的页面是能直接复制的文字。
以某丁的文档页面为例,按f12(或者右键选择“检测”或“审查元素”),打开开发者工具栏。
选择“device toolbar”小按钮,网页界面会缩小,选择上方的“选择设备”列表,第一次使用需要新建一个爬虫身份设备,点“编辑”,添加设备,设备名可以写“google”,useragent里填写为“googleBot”。 新建完成后,选择这个设备,刷新一下页面,页面文档内容区域就会出现文本形式的内容,可以直接复制。
二、以移动手机端的身份访问网页
在线文档平台为了让文档内容适配手机端,一般展示的手机端界面比pc端界面简单很多,这里以某度的文档页面为例。
跟上面步骤一样,按f12打开开发者工具栏,选择“device toolbar”小按钮,在设备列表里选择一个移动端的设备,这里选择“iphone6/7/8”,敲一下地址栏重新访问,文档页面的界面一般会变化,变得简单很多,而且没多少广告。
点击“加载更多”,将所有的文档内容展开。
部分版本的360安全浏览器下,把“device toolbar”小按钮按回,就可以右键全选,文档内容直接可以复制,将内容粘贴到word里了。