接受非ASCII字符

史蒂文·潘尼

考虑以下程序:

#include <stdio.h>
int main(int argc, char* argv[]) {
  printf("%s\n", argv[1]);  
  return 0;
}

我这样编译:

x86_64-w64-mingw32-gcc -o alpha alpha.c

问题是如果我给它一个非ASCII参数:

$ ./alpha róisín
r�is�n

如何编写和/或编译该程序以使其接受非ASCII字符?

要响应alk:否,程序打印错误。请参阅以下示例:

$ echo Ω | od -tx1c
0000000  ce  a9  0a
        316 251  \n
0000003

$ ./alpha Ω | od -tx1c
0000000  4f  0d  0a
          O  \r  \n
0000003
史蒂文·潘尼

最简单的方法是wmain

#include <fcntl.h>
#include <stdio.h>

int wmain (int argc, wchar_t** argv) {
  _setmode(_fileno(stdout), _O_WTEXT);
  wprintf(L"%s\n", argv[1]);
  return 0;
}

也可以用GetCommandLineW; 这是在HandBrake存储库中找到的代码的简单版本

#include <stdio.h>
#include <windows.h>

int get_argv_utf8(int* argc_ptr, char*** argv_ptr) {
  int argc;
  char** argv;
  wchar_t** argv_utf16 = CommandLineToArgvW(GetCommandLineW(), &argc);
  int i;
  int offset = (argc + 1) * sizeof(char*);
  int size = offset;
  for (i = 0; i < argc; i++)
    size += WideCharToMultiByte(CP_UTF8, 0, argv_utf16[i], -1, 0, 0, 0, 0);
  argv = malloc(size);
  for (i = 0; i < argc; i++) {
    argv[i] = (char*) argv + offset;
    offset += WideCharToMultiByte(CP_UTF8, 0, argv_utf16[i], -1,
      argv[i], size-offset, 0, 0);
  }
  *argc_ptr = argc;
  *argv_ptr = argv;
  return 0;
}

int main(int argc, char** argv) {
  get_argv_utf8(&argc, &argv);
  printf("%s\n", argv[1]);
  return 0;
}

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章