在线和离线语音到文本转换之间的区别

曼格什·潘奇瓦(Mangesh Panchwagh)

我正在研究语音到文本的android应用程序。Google API可用于在线和离线语音到文本的转换。

我已经完成了Google API(在线ANS和离线API)上文字语音的测试。已经观察到,与离线相比,在线语音文本提供了更好的准确性。现在我的问题是

  1. 联机模式和脱机模式有什么区别?
  2. 为什么离线模式会降低其准确性?有没有更精确的解决方案?
  3. 当我们收到任何电话时,数据连接就会丢失。有什么解决方案我一次可以实现的吗?
德博斯密特·雷(Debosmit Ray)

联机模式和脱机模式有什么区别?为什么离线模式会降低其准确性?有没有更精确的解决方案?

脱机模式是基于一个模型的,该模型的文件大小约为1。20.3MB;由于不需要互联网连接,因此不需要发送/接收数据。无论如何,该模型的语音到文本翻译速度比在线版本快6.5-7倍。这里最关键的一点是,该模型的字错误率达13.5%,尽管不是很高,但鉴于有限的数据和算法,它的误码率却很高。

在线系统显然可以访问更多的训练数据,并且可以通过更多的算法进行解析。我不认为脱机版本可以被认为是替代版本,但是当在线版本不可用时,可以认为它是替代版本。我读过一些文章,其中的用户声称“美国英语”比“英国英语”的效果更好,原因我并不完全了解。

3G不能同时提供语音和数据。WiFi / 4G没有此问题。还有许多其他已知问题,例如服务提供商的限制,LTE /非LTE,CDMA等。如果您有这样的限制,一种方法可能是合并一些设计更改,以使您能够缓存数据然后访问在线引擎,通话结束后。

以我有限的经验,对于离线功能,CMUSphinx似乎是一个更好的选择(因为Google每天最多只能打50个电话(?))。这里列出其他一些可用的API

启用离线语音转文本的研究论文在此处链接[ link ]。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

使用java离线语音到文本

Android语音转文本API(识别器意图)和Google Cloud语音API之间的区别?

Flutter / Dart:任何语言的语音转文本(离线和连续)

非英语语言的语音到文本的转换

Swift 4中的文本到语音转换

使用python 3.5进行语音文本到语音转换

文本转换之间的区别:大写;和所有大写

需要文本到语音和用于Linux的语音识别工具

解析和转换之间的区别?

使用 Sphinx4 的离线语音到文本的质量问题

无法在 Android 中执行文本到语音的转换

调用SpeechAPI在Azure上进行文本到语音的转换

WatchKit:WatchKit Apps中的语音到文本转换

如何停止所有VBS文本到语音转换?

文本转换:无和文本转换:初始之间的区别

文字到语音的转换

Stanford NLP:在线和离线版本之间的依赖关系树结果不同

三击选择文本和鼠标选择以及将单词复制到终端之间的区别

文本到语音 - Android Studio 中的 Google 地图和标记

Python kivy 文本到语音和 Popup 并行

Firefox 和 Chrome 中的文本到语音差异

C#和C / C ++中二进制到浮点转换之间的区别

适用于 android 和 IOS 的最佳移动“文本到语音”和“语音到文本”工具是什么?

迷惑于在线/离线/袖扣和不同版本

将文本转换为语音

文本到语音转换(TTS)延时3秒,说出文本

Flutter:文本到语音数组

Word 的文本到语音替换

隐式转换和显式转换之间的区别