我有一个字符串如下:
你好呀。我的邮政编码是 9876543。我的电子邮件 ID 也是 [email protected]。
我想通过从中删除非单词字符来清理这个字符串 ".", "@", numbers, ...
如何在 Scala 中实现它?Scala 中是否有一个内置函数,我只给出一个我不想要的字符列表,它会自动过滤字符串?
[感谢 Dima 指出*
使用时不需要replaceAll
]
简单的解决方法是
str.replaceAll("\\W", "")
这将用另一个字符串替换所有出现的正则表达式。单词字符的正则表达式是\w
,非单词字符是\W
,因此这会将所有非单词字符替换为空。
如果您想要更复杂的测试,请查看正则表达式的任何介绍以了解如何执行此操作。
如果您使用重音字符或其他字母表中的字符,请使用 Unicode 表达式。例如,要保留所有 Unicode 字母字符,请使用以下命令:
str.replaceAll("\\P{L}", "")
例如,这将避免丢失托儿所中的第一个 e。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句