Tag: scrape

使用Node.js Scraper从自动下载链接下载PDF

我正在使用Node.js(使用Request.js和Cheerio.js)进行扫描,并且正在导航下载链接以下载PDF并将其添加到计算机上的文件夹中。 链接自动启动下载,他们不只是导航到呈现的PDF,所以我不知道如何pipe道下载到节点的文件夹。

节点不能刮取某些页面

我不知道这是否与ColdFusion页面有关,但我不能刮这些.cfm页面 在具有request运行的目录中的命令行中: node> var request = require('request'); node> var url = 'http://linguistlist.org/callconf/browse-conf-action.cfm?confid=173395'; node> request(url, function (err, res, body) { if (err) { console.log(err) } else { console.log('body:', body) }; }); 我已经尝试了一些其他的.cfm网站,但他们的工作,只是得到空白的结果,所以我不知道它可能是什么 注意:我也试过这样做的准系统require('http').get(url,…)路线,但我得到了同样的空白结果