我有一个字符串格式不正确的数据库。数据如下所示:
"street"=>"\"\\u4e2d\\u534e\\u8def\""
什么时候应该是这样的:
"street"=>"中华路"
我的问题是,当双倍转义的字符串来自数据库时,它们没有被正确地解码为汉字。因此,假设我有这个变量;street="\"\\u4e2d\\u534e\\u8def\""
如果我打印print(street)
出结果是一个代码点字符串"\u4e2d\u534e\u8def"
此时我该怎么做才能转换"\u4e2d\u534e\u8def"
为实际的unicode字符?
首先将此字符串编码为utf8
,然后对其进行解码,unicode-escape
从而\\
为您处理:
>>> line = "\"\\u4e2d\\u534e\\u8def\""
>>> line.encode('utf8').decode('unicode-escape')
'"中华路"'
然后,您可以在"
必要时剥离
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句