在Node.JS中parsingMicrosoft Office文件
我正在开发一个用户可以上传Microsoft Office文档文件的Web应用程序。 现在,我们的服务器正在使用Express.js运行Node.JS,并且我们托pipe在Heroku上。 因此,我不认为我可以安装abiword或catdoc等程序。 我可以处理file upload,但不能parsing文档的内容。
我如何阅读doc文件的内容? 这些信息将被放入数据库中。 保留基本格式(粗体,斜体,下划线)会很好,但不是必需的。
虽然NPM似乎没有任何东西可以直接使用Word,但也可以使用REST API通过其他云服务来请求它。 例如, Saaspose (着名的Aspose工具)具有用于Word , Excel , PDF等的公共API。 他们在他们的页面上列出了node.js,javascript和Heroku支持。
编辑:
我看到Saaspose现在被称为Aspose for Cloud
声称类似的另一个API是Doxument
办公软件包: npm install office
似乎提供了至less部分的答案。 我用它来读取Excel文件,到目前为止还没有尝试过任何的Word文档。
似乎还没有。 看到下面的东西可能有所帮助。
我可以使用Node.js阅读PDF或Word文档吗?