将Unicode表示形式转换为格式化的Unicode？

lindsay 发表于 Dev

16

林赛

我在理解unicode表达式到其各自字符的翻译时遇到了一些困难。我一直在看unicode规范，并且遇到了各种格式如下的字符串U+1F600。据我所知，似乎没有内置的函数知道如何将这些字符串转换为适用于Python的正确格式，例如\U0001F600。

在我的节目，我已经做了一个小的正则表达式，会发现这些U\+.{5}模式和替换U+用\U000。不过，我发现的是，这个语法是不是所有Unicode字符，比如0宽度加入，实际上是应该从翻译同U+200D来\u200D。

因为我不知道正确的unicode转义序列的每个变体，所以处理这种情况的最佳方法是什么？我只能检查有限数量的这些特殊字符，还是我会完全以错误的方式进行处理？

Python版本是2.7。

威姆

我认为您最可靠的方法是将数字解析为整数，然后使用unichr该代码点进行查找：

unichr(0x1f600)  # or: unichr(int('1f600', 16))

注意：在Python 3上，它仅为chr。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-05-25

我来说两句

0 条评论

登录后参与评论

上一篇：Chromium 81不再显示点文件

相关文章

将unicode的字符串表示形式转换为unicode

将十六进制表示形式转换为unicode

HOWTO：将字符串中的Unicode字符表示形式转换为实际的Unicode字符

将java字符串中的unicode转换为unicode的字符串表示形式

将转义的Unicode字符转换为Unicode表示法

如何将Unicode代码点转换为它们的字符表示形式？

如何将unicode转换为4位二进制表示形式？

将Unicode字符串转换为十六进制表示形式

将数字的Unicode表示形式转换为ASCII字符串

如何将 Unicode（URL 编码/百分比编码）表示转换为真实形式

如何将格式化的字符串转换为键，值字典形式？

将pfx格式化的私钥转换为pem格式

将转义的unicode序列转换为人类可读的格式

将Unicode字符转换为字符串格式

将UnicodeÂÂ°°à±Â‡ÃÂ°ÂÂÂ±Ã转换为正常的unicode消息

格式化 Unicode 时间值

在格式化程序中打印 Unicode

如何在MATLAB中将原始Unicode十六进制转换为Unicode表示形式

将UNICODE转换为shiftJIS

将String转换为unicode？

将Unicode转换为汉字

将Unicode转换为中文

将unicode转换为字符

将单词转换为 Unicode

如何将格式为 unicode 的字符串转换为 unicode？

MySQL 将格式化日期转换为 int

将预格式化的文本转换为chararray

SQL：将 bigint 类型转换为格式化日期

将系统日期转换为格式化日期

TOP 榜单

文章

热门标签

归档