语音识别语音到文本在 python 中不起作用

四月

我已经编写了这段代码来将音频转换为文本。它不会转换整个文本。音频的总时长为 1.21 分钟。但是该程序仅从音频中输出 4 个单词,音频中的其余对话都丢失了。有人可以帮我解决这个问题。下面是代码。

import speech_recognition as sr
from gtts import gTTS
import os
import playsound

r = sr.Recognizer()

with sr.AudioFile('Track1.wav') as source:
    r.adjust_for_ambient_noise(source, duration=0.5)
    audio = r.listen(source)
    try:
        text = (r.recognize_google(audio, language="en-US"))
        print('working on...')
        print(text)
    except:
        print('Sorry.. run again..')
阿德南

尝试不同的音频文件。如果您也只能获得其他音频文件的几个单词,则可能是对语音识别库中的 identify_google 函数使用的“免费”默认 Google API 密钥的限制。在这种情况下,您将需要自己的 API 密钥来转录更长的音频文件。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章