Tag: scraping cheerio

如何将图像从请求pipe道到node.js中的pdfkit?

首先,我对JavaScript和Node.js都是一个新手,所以如果我的问题是愚蠢的,那么对不起。 我试图从网站上刮掉文本和图像,并使用请求,cheerio和pdfkit将其导出为pdf,但是我遇到了问题。 我能够刮这些图像,并保存在本地使用这个: var $ = cheerio.load(body); $("#mediatab1 img").each(function(){ var image= 'http://WWW.WEBSITE.no' + $(this).attr('src'); images.push(image); }); for(var i = 0; i < images.length; i++){ request(images[i]).pipe(fs.createWriteStream('images/' + i + '.jpg')); } 但! 这是问题: 1.意图:当我尝试使用PDF文件写入文件 doc.image('images/0.jpg'); 我所得到的就是 Error: Unknown image format. at Function.PDFImage.open (C:\nodejs\node_modules\pdfkit\js\im age.js:41:15) at PDFDocument.module.exports.image (C:\nodejs\node_modules\pd fkit\js\mixins\images.js:27:26) at Request._callback (C:\nodejs\prosjekt.js:29:6) at Request.self.callback (C:\nodejs\node_modules\request\reque st.js:344:22) at […]