在字符串中附加带有相应字形的 unicode 代码点

用户7623610

我在python中有一个字符串

set = "U+06A4, U+06A7, U+06A8, U+06A9, U+06AF"

我想找U+到此字符串中以 开头的所有单词,并将它们附加到相应的字形中。

例如,说

word_found_in_string = 'U+064A'

我想用

replace_with = 'U+064A chr(int(word_found_in_string[2:6],16))'

wherechr(int(word_found_in_string[2:6],16))在我的输出文件打印相应的字形。

我如何使用re模块对我的字符串中的所有 unicode 代码点执行此操作,以便我的结果字符串的所有代码点都附加有相应的字形?

马克·托洛宁

re.sub可以取一个函数进行替换。这里我使用了一个 lambda 函数。对于正则表达式的每个匹配项,都会使用匹配对象调用它。m.group(0)是整个匹配项,m.group(1)是与四个十六进制数字匹配的括号表达式。

import re
s = 'U+06A4, U+06A7, U+06A8, U+06A9, U+06AF'
s = re.sub(r'U\+([0-9A-F]{4})',lambda m: m.group(0)+' '+chr(int(m.group(1),16)),s)
print(s)

输出:

U+06A4 ڤ, U+06A7 ڧ, U+06A8 ڨ, U+06A9 ک, U+06AF گ

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

C获取字符的Unicode代码点

从表示Unicode代码点的String中获取Unicode字符?

Unicode代码点转换中的“语言处理”?

如何使Python字符串包含unicode代码点?

如何遍历Java字符串的unicode代码点?

Java将unicode代码点转换为字符串

.NET字符串对象和无效的Unicode代码点

如何在python中从unicode代码点转换为实际的unicode字符串?

将%uXXXX替换为Ruby中的相应Unicode代码点

根据字符串的位置,阿拉伯字符是否具有不同的Unicode代码点?

字符可以代表所有Unicode代码点吗?

在zsh中获取字符的Unicode代码点

如何获取Java中字符的Unicode代码点?

在Go中遍历unicode字符串时跳过n个代码点

使用Python获取字符的Unicode代码点

使用Python获取字符的Unicode代码点

在Go中将Unicode代码点转换为文字字符

Haskero失败,显示“不是有效的Unicode代码点!”

获取代码点的所有Unicode别名

在没有Java 7的情况下,如何在regex字符串中匹配大于\ uFFFF的Unicode代码点?

比较 Python3 中的 Unicode 代码点范围

在Python中获取代码点的Unicode版本

如何在Ruby中挽救“无效的Unicode代码点”?

在Java / Kotlin中将字符串与等效但不同的Unicode代码点进行比较

C#-从任何字符串中找到一个Unicode代码点的代理对?

如何将字符串存储为“ Unicode代码点序列”?

Unicode代码点和Unicode标量之间有什么区别?

“非代理Unicode代码点”在Unicode中是什么意思?

最大Unicode代码点的索引