Rails或节点的网页分析器?

我想build立一个parsing器,它分析一个XML文档的多个页面。 这些页面包括图像和其他媒体,由额外的静态资产服务器提供服务。 现在我的问题是:

我应该使用rails来parsing文档或创build一个特殊的节点服务器,这是什么? 由于performance,我想到了节点。

parsing器从xml文件中创build一个html文档。

提前致谢!

编辑:这些html页面可以从多个用户查看。

我不认为这样做是非常有用的,如果你可以每秒用ruby或者每秒200k页面parsing每秒10万页,除非你parsing数十亿个xml文档(我把这些数字提高了)。 你应该使用你最熟悉的工具。

但是,在node.js中有一些很酷的网页抓取/parsing库

  • 你可以使用jQuery与node.js!
  • node.io – 网页刮板模块,支持jquery,分布式处理,模块等等
  • 另一个node.js网页刮板模块 – 并行取页面,添加速率限制

我会使用节点,因为轨道似乎有点矫枉过正。 但是,如果你更熟悉的W /ruby,而不是铁轨你应该做的瓦特/ Sinatra或任何其他较小的框架。 只是我的观点是,铁轨已经结束了这一点。