使用WebSockets的IBM Watson语音到文本

扎伊德·阿米尔

我正在尝试使用Watson Developer Cloud Java SDK转录大型音频文件。我尝试了Sessionless方法,并且效果很好,但是当我尝试WebSockets方法时,事情变得不可靠了。

在大多数情况下,该方法只会返回而不会SpeechResult传递给委托。它很少会起作用,但只会在最初的几秒钟内记录下来。

这是我的代码如下所示:

static SpeechResults transcript = null;
private static String SpeechToText(String audioFile) throws FileNotFoundException {
        SpeechToText service = new SpeechToText();
        service.setUsernameAndPassword("<!!USERNAME!!>", "<!!PASSWORD!!>");
        service.setEndPoint("https://stream.watsonplatform.net/speech-to-text/api");

        RecognizeOptions options = new RecognizeOptions();
        options.contentType("audio/ogg;codecs=opus");
        options.continuous(Boolean.TRUE);
        options.inactivityTimeout(-1);
        options.model(Models.GetModelName(Models.SpeechModelEnums.ArabicBroadband));
        options.timestamps(Boolean.TRUE);
        options.wordAlternativesThreshold(0.5);
        options.wordConfidence(Boolean.TRUE);

        options.interimResults(Boolean.FALSE);

        File audio = new File(audioFile);

        //This is my sessionless call
        //SpeechResults transcript = service.recognize(audio, options);


        service.recognizeUsingWebSockets(new FileInputStream(audio),  options, new BaseRecognizeDelegate()
        {
                @Override
                public void onMessage(SpeechResults speechResults){
                System.out.println(speechResults);                
                }
            }
        );

        return "";//transcript.toString();
    } 

我已连续启用。我尝试摆弄interimResults,但那没有用。

我究竟做错了什么?

德国人阿塔纳西奥

您提到的问题已在3.0.0-RC1版本中修复
我已经回答了类似的问题,并添加了一个代码片段,该片段可使用WebSockets识别音频文件。

README开始3.0.0-RC1有一个WebSocket示例

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

将WAV录制到IBM Watson语音到文本

语音到文本Ibm Watson C#的语音,长音频超过100 MB

使用ibm-watson服务C#进行语音到文本

IBM Watson语音到文本仅使用Java SDK返回第一个单词

使用ibm watson文本到语音服务处理多个查询

如何检测语音到文本中的句子检测是否已完成(Unity IBM Watson sdk)?

IBM Watson语音到文本发送麦克风数据关闭了连接

IBM Watson语音到文本Python,“ DetailedResponse”对象没有属性“ getResult”

Twilio的IBM Watson语音到文本插件影响一个电话号码

IBM Watson IAM令牌适合所有服务还是特定于每种服务(例如语音到文本)?

大于〜7mb的文件将引发“未收到响应”。IBM Watson语音到文本异步createJob调用

IBM Watson语音对文本的单词置信度差异

IBM Watson语音转文本:无法使用Swift SDK转录文本

编辑python中的wav文件头以与QSound / pyqt5一起使用(Watson文本到语音TTS)

如何使用curl访问IBM语音到文本api?

使用IBM Watson语音文本NPM模块难以注册回调URL

在Watson文本和语音中使用不同的语调

使用python 3.5进行语音文本到语音转换

使用java离线语音到文本

文本到语音不起作用,使用语音到文本获取文本时

Shiny Watson 实时文本到语音

使用 IBM Watson 的语音转文本会导致在识别关键字时多次调用方法

IBM Watson语音对带有IAM API密钥的WebSocket授权文本

使用JavaScript覆盖文本框语音到文本

使用Postman测试语音转文本Watson API,但出现错误401

在 twilio php api 上使用文本到语音进行通话

使用Microsoft认知WAV文件的Android语音到文本

使用Windows 8.1(SAPI)的Python文本到语音库

使用IVONA文本到语音的AWS Java NoSuchMethodError