Noodle.js安装程序/ jQuery过程(Web Scraping帮助!)

我已经通过npm install安装了noodle.js,这就是我现在的代码。 但是,当我运行这个文件(noodleTest.js)在terminal:节点noodleTest.js,我得到以下错误:jQuery.getJSON不是一个函数。 我已经看了大多数关于这个问题的堆栈溢出答案,并找不到修复。 通过http://noodlejs.com提供的例子,它在控制台中返回一个数组,但是当我试图运行这个代码片段时,我收到一个错误。 任何帮助表示赞赏。

var noodle = require('noodlejs'), jQuery = require ('jquery'); var query = { url: 'http://google.com/search?q=javascript', type: 'html', selector: 'h3.r a', extract: 'text' }, uriQuery = encodeURIComponent(JSON.stringify(query)), request = 'http://example.noodlejs.com/?q=' + uriQuery + '&callback=?'; // Make Ajax request to Noodle server jQuery.getJSON(request, function (data) { console.log(data[0].results); }); 

编辑 :我试着按照给出的例子
http://%20github.com/dharmafly/noodle#noodle-as-a-node-module ,并使用noodlejs.com运行的例子,但我不知道如何读取数据,或如何提取对象中的内容。 var noodle = require('noodlejs');

 noodle.query({ url: 'http://google.com/search?q=javascript', selector: 'h3.r a', extract: 'text' }) .then(function (results) { console.log(results); }); 

这是以下输出:

  [noodle log #1] Thu Jul 07 2016 00:09:43 GMT-0700 (PDT) Memory: 18.00mb (18870272 bytes) Noodle: The query follows... {"url":"http://google.com/search?q=javascript","selector":"h3.ra","extract":"text","type":"html","cache":true} [noodle log #2] Thu Jul 07 2016 00:09:44 GMT-0700 (PDT) Memory: 19.00mb (19918848 bytes) Cache: Page has been cached [noodle log #3] Thu Jul 07 2016 00:09:44 GMT-0700 (PDT) Memory: 20.00mb (20967424 bytes) Cache: Result has been cached { results: [ { results: [Object], created: 2016-07-07T07:09:44.286Z } ] } 

这是一个面条查询的例子。 不要关注我们正在报废的细节,看看我要求的select者和我想要提取的东西。

你可以从页面中随机挑选一个select器,提取的数据是文本。 但看到提取的文本看看我做了什么结果。

 var noodle = require('noodlejs'); noodle.query({ url: 'http://edition.cnn.com/', selector: '#intl_homepage1-zone-1 > div.l-container > div > div.column.zn__column--idx-0 > ul > article > a > h2', extract: 'text' }) .then(function (results) { console.log(results); console.log(results.results[0]); }); 

结果是链接我没有真正检查为什么也许如果你研究,你可以更好地使用它,但如果你两次进入结果,你可以看到我已经做了,你最终会得到你想要提取的信息。