C / C ++中的跨平台unicode：要使用哪种编码？

ErikKou 发表于 Linux

ErikKou：

我目前正在研究一个业余项目（C / C ++），该项目应该在Windows和Linux上都能工作，并且完全支持Unicode。可悲的是，Windows和Linux使用不同的编码，这使我们的生活更加困难。

在我的代码中，我尝试使用尽可能通用的数据，以使Windows和Linux都容易使用。在Windows中，默认情况下wchar_t编码为UTF-16，而在Linux中则编码为UCS-4（如果我输入错了，请更正我）。

我的软件打开（{_wfopen，UTF-16，Windows}，{fopen，UTF-8，Linux}），并将数据写入UTF-8中的文件。到目前为止，这一切都是可行的。直到我决定使用SQLite。

SQLite的C / C ++接口允许一个或两个字节的编码字符串（单击）。当然，这不适用于Linux中的wchar_t，因为Linux中的wchar_t默认为4字节。因此，从sqlite写入和读取需要Linux转换。

当前，除了Windows / Linux的例外，代码杂乱无章。我希望坚持将数据存储在wchar_t中的标准思想：

Windows中的wchar_t：文件路径没有问题，对sqlite的读/写没有问题。无论如何，应将数据写入文件。
Linux中的wchar_t：由于UTF-8编码，在读/写到sqlite（wchar_t）之前进行转换而导致的文件路径异常，以及在将数据写入文件时对于Windows相同。

看完（这里）后，我确信我应该在Windows中坚持使用wchar_t。但是在所有这些工作之后，麻烦就开始了移植到Linux。

目前，我正在考虑将其全部重做以保留简单的char（UTF-8），因为它适用于Windows和Linux，并牢记一个事实，我需要在Windows中的每个字符串“ WideCharToMultiByte”以实现UTF-8。使用简单的基于char *的字符串将大大减少Linux / Windows的异常数量。

您有使用unicode跨平台的经验吗？关于仅将数据存储在UTF-8中而不使用wchar_t的想法有什么想法？

幼犬

所有平台上的UTF-8都可以及时转换为Windows的UTF-16，这是跨平台Unicode的常见策略。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-08-6

我来说两句

0 条评论

登录后参与评论

TOP 榜单

文章

C / C ++中的跨平台unicode：要使用哪种编码？

C / C ++中的跨平台unicode：要使用哪种编码？

隐藏发件人没有短信PHP

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

在浏览器中请求URL时会发生什么？

flask-admin 如何自定义删除按钮

材质UI垂直滑块。如何改变在垂直材料UI滑块导轨的厚度（反应）

用日期数据透视表和日期顺序查询

Jqgrid：多级别组摘要

java io ioexception无法解析服务器地址解析器的响应

Swift如何使用Base64Url编码JWT标头和有效负载之类的json对象

sshd AllowGroups组未授予访问权限

jQuery无限滚动固定div中的滚动

android 背部按下

Flexbox CSS 对齐属性环境惰性？

为什么随机森林中的平均降低基尼系数取决于人口规模？

ClickHouse 创建临时表

为什么PlusShare.Builder setRecipients方法不起作用？

如何在Android中识别MICR代码

PyQt4.QtCore模块无法向sip模块注册

正则表达式，用于查找所有以任何字母开头和数字开头的文件

是否可以通过编程方式对很多动画进行重新着色？

机器密钥生成