在字符串中附加带有相应字形的 unicode 代码点

user7623610 发表于 Dev

17

用户7623610

我在python中有一个字符串

set = "U+06A4, U+06A7, U+06A8, U+06A9, U+06AF"

我想找U+到此字符串中以开头的所有单词，并将它们附加到相应的字形中。

例如，说

word_found_in_string = 'U+064A'

我想用

replace_with = 'U+064A chr(int(word_found_in_string[2:6],16))'

wherechr(int(word_found_in_string[2:6],16))在我的输出文件中打印相应的字形。

我如何使用re模块对我的字符串中的所有 unicode 代码点执行此操作，以便我的结果字符串的所有代码点都附加有相应的字形？

马克·托洛宁

re.sub可以取一个函数进行替换。这里我使用了一个 lambda 函数。对于正则表达式的每个匹配项，都会使用匹配对象调用它。m.group(0)是整个匹配项，m.group(1)是与四个十六进制数字匹配的括号表达式。

import re
s = 'U+06A4, U+06A7, U+06A8, U+06A9, U+06AF'
s = re.sub(r'U\+([0-9A-F]{4})',lambda m: m.group(0)+' '+chr(int(m.group(1),16)),s)
print(s)

输出：

U+06A4 ڤ, U+06A7 ڧ, U+06A8 ڨ, U+06A9 ک, U+06AF گ

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-05-29

我来说两句

0 条评论

登录后参与评论

上一篇：如何通过AJAX传递和使用成功/失败响应

相关文章

C获取字符的Unicode代码点

从表示Unicode代码点的String中获取Unicode字符？

Unicode代码点转换中的“语言处理”？

如何使Python字符串包含unicode代码点？

如何遍历Java字符串的unicode代码点？

Java将unicode代码点转换为字符串

.NET字符串对象和无效的Unicode代码点

如何在python中从unicode代码点转换为实际的unicode字符串？

将％uXXXX替换为Ruby中的相应Unicode代码点

根据字符串的位置，阿拉伯字符是否具有不同的Unicode代码点？

字符可以代表所有Unicode代码点吗？

在zsh中获取字符的Unicode代码点

如何获取Java中字符的Unicode代码点？

在Go中遍历unicode字符串时跳过n个代码点

使用Python获取字符的Unicode代码点

使用Python获取字符的Unicode代码点

在Go中将Unicode代码点转换为文字字符

Haskero失败，显示“不是有效的Unicode代码点！”

获取代码点的所有Unicode别名

在没有Java 7的情况下，如何在regex字符串中匹配大于\ uFFFF的Unicode代码点？

比较 Python3 中的 Unicode 代码点范围

在Python中获取代码点的Unicode版本

如何在Ruby中挽救“无效的Unicode代码点”？

在Java / Kotlin中将字符串与等效但不同的Unicode代码点进行比较

C＃-从任何字符串中找到一个Unicode代码点的代理对？

如何将字符串存储为“ Unicode代码点序列”？

Unicode代码点和Unicode标量之间有什么区别？

“非代理Unicode代码点”在Unicode中是什么意思？

最大Unicode代码点的索引

TOP 榜单

文章

热门标签

归档