Java库,用于文本规范化

瓦洛兹卡:

我正在寻找允许文本“标准化”的Java库。类似于standart Normalizer,但更宽(类似于utf8proc LUMP)。

它应该将所有特殊字符替换为ASCII等效项(如果可能的话)。代码的所有空格变型为32,负号的所有变体(长,短,细等)都变为代码45,依此类推。

史蒂文·鲁米斯(Steven R.Loomis):

您应该查看CLDR中的Latin-ASCII转换它将在ICU 4.6中

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章