如何将格式为 unicode 的字符串转换为 unicode?

随机的家伙

我有一个带有字符串 '\u96e8' 的变量,我想将其转换为 unicode,因为函数 kanji_to_romaji() 只接受 unicode。我该怎么做?我在 python 2.7

# -*- coding: UTF-8 -*-
from kanji_to_romaji import kanji_to_romaji
message = '\u96e8'
message = unicode(message)
x = kanji_to_romaji(message)
print(x)
切普纳

使用ast.literal_eval

>>> message = '\u96e8'
>>> ast.literal_eval('u"{}"'.format(message))
u'\u96e8'

诀窍是构造一个包含unicode字符串文字字符串作为参数传递给literal_eval. 也就是说,u"\u96e8"而不仅仅是\u96e8.

(不过,这只是部分正确。如果它message本身的值包含双引号,它就会失败。可能还有其他情况也会失败。)

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章