在Node.JS中parsingMicrosoft Office文件

我正在开发一个用户可以上传Microsoft Office文档文件的Web应用程序。 现在,我们的服务器正在使用Express.js运行Node.JS,并且我们托pipe在Heroku上。 因此,我不认为我可以安装abiword或catdoc等程序。 我可以处理file upload,但不能parsing文档的内容。

我如何阅读doc文件的内容? 这些信息将被放入数据库中。 保留基本格式(粗体,斜体,下划线)会很好,但不是必需的。

虽然NPM似乎没有任何东西可以直接使用Word,但也可以使用REST API通过其他云服务来请求它。 例如, Saaspose (着名的Aspose工具)具有用于Word , Excel , PDF等的公共API。 他们在他们的页面上列出了node.js,javascript和Heroku支持。

编辑:

我看到Saaspose现在被称为Aspose for Cloud

声称类似的另一个API是Doxument

办公软件包: npm install office似乎提供了至less部分的答案。 我用它来读取Excel文件,到目前为止还没有尝试过任何的Word文档。

似乎还没有。 看到下面的东西可能有所帮助。

我可以使用Node.js阅读PDF或Word文档吗?