Tag: speech to text

如何提取从createRecognizeStream()方法返回的值?

使用Watson语音到文本服务如何提取从createRecognizeStream()方法返回的值? 这是一个示例代码块。 我想在terminal看到中期的结果,但我得到的是这个。 如何设置结果出现的选项? { results: [ { alternatives: [Object], final: false } ], result_index: 0 } { results: [ { alternatives: [Object], final: false } ], result_index: 0 } { results: [ { alternatives: [Object], final: false } ]… 他们应该看起来像这样: { "results": [ { "alternatives": [ { "timestamps": [ [ "Here", 0.08, 0.63 ], […]

IBM Watson语音到Node.js Web应用程序上的文本audio转换

问题的关键是IBM Watson Speech to Text只允许FLAC,WAV和OGG文件格式上传并与API一起使用。 我的解决scheme是,如果用户上传一个MP3,在发送文件到Watson之前,数据转换将发生。 本质上,用户上传一个mp3,然后使用ffmpeg或sox将audio转换为OGG,然后将audio上传到Watson。 我不确定的是:为了允许audio转换发生,我必须在Node.js Watson代码中修改哪些内容? 下面链接是我正在通过的沃森回购。 我相信这个文件必须被修改,就是我已经链接到的fileupload.js文件,但是修改的地方是我不确定的。 我已经通过SO和developerWorks,IBM SO来了解这个问题的答案,但是我还没有看到这是我在这里发布的原因。 如果有必要,我会很乐意澄清我的问题。 沃森演讲到文本回复