如何在python中删除所有unicode表示形式

Candi00

我正在尝试删除文档中所有特殊字符的表示形式,例如文档的一部分说:“ world \ u2019s”,当我将其拆分时会给出,['world', '\u2019', 's']但我只需要删除单词(unicode和's')。
我已经删除了所有标点符号,这适用于通常在这些unicode表示形式上未显示的实际标点符号。而且我还尝试使用正则表达式来匹配以“ \”开头的所有内容,但似乎也不起作用。

合酶
import re

string = "world\u2019s"

print (re.sub(r"\b([^\s]+)\\([^\s]+)\b",r'\1',str(string.encode('ascii', 'backslashreplace'), 'ascii')))

输出:

world

您可以将其应用于整个字符串文档,应该可以使用。

import re

string = "world\u2019s h\u2018e"

print (re.sub(r"\b([^\s]+)\\([^\s]+)\b",r'\1',str(string.encode('ascii', 'backslashreplace'), 'ascii')))

输出:

world h

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何删除Python中特定字符之前的所有字符?

Redis Python-如何在python中根据特定模式删除所有键,而无需python迭代

如何删除python中特定字符之后的所有字符?

如何在Swift中删除视图的所有子视图?

如何在Swift 2中删除所有地图注释

在Python中打印所有Unicode字符

如何在Django中获取阿拉伯字符串的Unicode表示形式?

如何在RStudio环境中删除所有“值”?

如何在ARCore中删除所有飞机

如何从python列表中删除所有列表?

如何在不删除(删除)数据库的情况下从所有表中删除所有行?

如何在Qt Creator中禁用/删除所有断点

如何在PostgreSQL的列中删除','之后的所有内容

Python:如何从Pandas列中删除所有非数值?

如何在Snowflake中删除Unicode字符?

如何使用python在Excel中删除所有零值

如何在Python中删除从字符串到特定字符的所有内容

如何从字符串python中删除所有表情符号(unicode)字符

如何在roblox中删除所有克隆的gui

如何在python的Google App Engine中删除NDB模型的所有实体?

如何删除python tkinter treevieww中的所有行?

如何在Js的网址中删除所有目标

如何在python中以列表的形式获取类的所有属性

删除datatables表(jquery)中的所有行后,如何在CSS中删除叠加层?

如何删除python中可用的所有变量以释放内存?

如何在csv文件python的所有行中删除逗号

如何从 Ubuntu 中删除所有 python 痕迹

如何在所有 xml python 中删除重复的 xml 节点

如何在vim中删除单词后的所有内容