我已经编写了这段代码来将音频转换为文本。它不会转换整个文本。音频的总时长为 1.21 分钟。但是该程序仅从音频中输出 4 个单词,音频中的其余对话都丢失了。有人可以帮我解决这个问题。下面是代码。
import speech_recognition as sr
from gtts import gTTS
import os
import playsound
r = sr.Recognizer()
with sr.AudioFile('Track1.wav') as source:
r.adjust_for_ambient_noise(source, duration=0.5)
audio = r.listen(source)
try:
text = (r.recognize_google(audio, language="en-US"))
print('working on...')
print(text)
except:
print('Sorry.. run again..')
尝试不同的音频文件。如果您也只能获得其他音频文件的几个单词,则可能是对语音识别库中的 identify_google 函数使用的“免费”默认 Google API 密钥的限制。在这种情况下,您将需要自己的 API 密钥来转录更长的音频文件。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句