有几种获取所有Unicode字符名称列表的方法:例如,使用python模块unicodedata
(如Unicode字符名称列表中所述)或使用网站:https : //unicode.org/charts/charindex.html,但这是不完整的,您必须打开并解析PDF才能找到名称。
但是,所有Unicode字符名称的正式来源/存储库是什么?(这样,如果添加了新字符,则列表会更新,因此我正在寻找机器可读格式的这些名称的初始来源)。
我正在寻找带有Justcode point
和name
CSV或任何其他格式的列表:
code character name
...
0102 LATIN CAPITAL LETTER A WITH BREVE
0103 LATIN SMALL LETTER A WITH BREVE
...
实际字符数据(包括字符名称和许多其他详细信息)的官方来源是Unicode字符数据库。
可以通过http://www.unicode.org/Public/UCD/latest/访问最新版本的数据文件。
具体的名称可以在文件中NamesList.txt
找到。该文件的格式在此处描述。
这是CSV格式的列表:https : //www.unicode.org/Public/UCD/latest/ucd/UnicodeData.txt
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句