Tag: tesseract

Tesseract Node.js – 使用“lang”选项导致崩溃

Tesseract.js与英语不同的基本用法使整个系统崩溃: var options = { lang: 'deu', }; var image = require("path").join(__dirname, 'lib/images/ocr-test-text.png'); var Tesseract = require('tesseract.js') Tesseract.recognize(image, options) .progress(function (info) { console.log(info); }) .then(function (data) { console.log('done', data); process.exit(); }) 触发以下错误: > node index.js { status: 'loading tesseract core' } { status: 'loaded tesseract core' } { status: 'initializing tesseract', progress: 0 } pre-main […]

Node.js比使用Tesseract.Js的浏览器(Safari)慢20倍

新来的JS和非常新的节点。 在Safari中运行Tesseract.js(文本识别软件: http : //tesseract.projectnaptha.com )大约需要10秒,并立即开始输出进度。 节点(v6.9.1)(从terminal运行或通过电子运行)在CPU开始输出到控制台之前,运行CPU到100%4分钟20秒。 然后在几乎同一时间结束。 什么故障排除步骤build议? 这是常见的节点? 只有在日志中看到的差异是Safari“在cachingeng.traineddata中find”清除和禁用caching只影响最小的时间。 已经尝试了一些.JPG和.PNG(300-600kb)的文件,但是BMP(3.7MB)却给出了17秒的快速响应 – 然后错误并没有完成。 (这是“下一个打勾”问题?) var Tesseract = require('tesseract.js'); var image = "./images/sample.jpg"; function tesseract(){ Tesseract.recognize(image) .progress(function(message){console.log(message)}) .then(result => console.log(result.text)) } tesseract(); (编辑器强制将输出格式化为代码) NODE console.Log >Bash-3.2$ node JustTess.js *Waits 4+ min and Then* { status: 'loading tesseract core' } { status: 'loaded tesseract core' } […]