Tag: scraping zombie.js

node.js中的Zombie.js无法抓取某些网站: 下面的简单脚本返回一堆垃圾。它适用于大多数网站，但不威廉山： var Browser = require("zombie"); var assert = require("assert"); // Load the page from localhost browser = new Browser() browser.visit("http://sports.williamhill.com/bet/en-gb/betting/y/5/et/Football.html", function () { browser.wait(function(){ console.log(browser.html()); }); }); 与节点一起运行输出： S J ꪙRUݒ kf 6 Efr2 Riz ^ 0 X { ^ a yp p Ή`（S] – 'N8q /ݻU;？݇ׯ荣ٲ> -3 GEE，mFMIQ2ڊZGOJ ^ SC〜gJO缇öݎP ET n;v […]

与使用zombie.js网站抓取问题: 我需要做一些networking抓取。在玩过不同的Webtesting框架之后，其中大部分的地方要么太慢（Selenium），要么我的需求太多（env.js），我决定zombie.js看起来最有前途，因为它使用一套可靠的库HTMLparsing和DOM操作。然而，在我看来，它甚至不支持基本的基于事件的Javascript代码，如下面的网页： <html> <head> <title>test</title> <script type="text/javascript"> console.log("test script executing…"); console.log("registering callback for event DOMContentLoaded on " + document); document.addEventListener('DOMContentLoaded', function(){ console.log("DOMContentLoaded triggered"); }, false); function loaded() { console.log("onload triggered"); } </script> </head> <body onload="loaded();"> <h1>Test</h1> </body> </html> 然后我决定手动触发这些事件： zombie = require("zombie"); zombie.visit("http://localhost:4567/", { debug: true }, function (err, browser, status) { doc = […]

Interesting Posts

mongoose更新位置/指数数组中的项目

每次我做一个新项目，我应该安装快递，节点等？

Typescript Express项目中的客户端Javascript

招摇的清单API for Worknik

为什么使用不同的文件快速路由不起作用？

ZINTERSTORE与node_redis的dynamic参数

铸造到数组失败与moongoose和字典

从anom访问实例variables。 function在咖啡脚本

Rails，Node.js跨服务器authentication

寻找一种更有效的方法在mongoose-q中做很多查询

Node.js网页抓取问题| 请求| cheerio

如何加载phonegap / cordova与玉？

节点RESTful APItesting

简单的node.js服务器没有error handling失败的请求

向远程URL发送UDP请求