nodeJS请求包加载与JavaScript
我想获取一个instagramconfiguration文件的请求包,但自从Instagram加载的东西通过JavaScript(reactJS)许多信息都丢失:/
你有什么想法如何请求页面,等待5秒钟,然后下载!
使用PhantomJS等无头浏览器。
与Node.JS集成的模块可用: https : //github.com/amir20/phantomjs-node
var phantom = require('phantom'); phantom.create().then(function(ph) { ph.createPage().then(function(page) { page.open('https://www.instagram.com/collectnet/').then(function(status) { console.log(status); page.property('content').then(function(content) { console.log(content); page.close(); ph.exit(); }); }); }); });
很难在网页上检测Javascript执行的结束,但是如果您知道需要等待加载的内容,则可以检查该特定元素的存在。 这里演示一个示例: https : //stackoverflow.com/a/38149362/2128499