创build一个可以在发送给客户端之前修改http响应的http代理

我正在使用wget从网上抓取一些东西,但我不想跟随页面的一部分。 我以为我可以设置一个代理,它会删除我不想处理的网页的部分,然后将其返回给wget,但我不知道我将如何实现这一点。

有没有一个代理,让我轻松地修改在Python或Node.js HTTP响应?

有几种方法可以实现这个目标。 这应该让你开始(使用node.js)。 在下面的示例中,我获取google.com并用“foobar”replace“google”的所有实例。

 // package.json file... { "name": "proxy-example", "description": "a simple example of modifying response using a proxy", "version": "0.0.1", "dependencies": { "request": "1.9.5" } } // server.js file... var http = require("http") var request = require("request") var port = process.env.PORT || 8001 http.createServer(function(req, rsp){ var options = { uri: "http://google.com" } request(options, function(err, response, body){ rsp.writeHead(200) rsp.end(body.replace(/google/g, "foobar")) }) }).listen(port) console.log("listening on port " + port) 

在nodejs中,我将fork node-http-proxy并根据需要自定义代码。

更简单的写一个HTTP代理从头开始,恕我直言。