如何将双字节字符/字符串转换为单字节,反之亦然?

拉杰什·阿帕达亚亚

我正在日语文本上工作,我有2个要求。

  1. 将字符串中的所有宪章转换为双字节字符。该字符串可以包含一个或两个字符,也可以包含两个字符,但是结果字符串应仅为双字节。

例如:东京都中央区晴海1-8-11

预期的输出:东京都中央区晴海<1> Chome <8> <11>。所有<>应包含双字节字符

  1. 将所有宪章转换为单字节字符。字符串类似于要求1,但结果字符串应仅包含单字节字符。

例如:ADORES,Inc。

预期输出: ADORES,INC。

我正在从包含近300列的csv文件中读取此数据,只有3列需要这些操作,其余应保持不变。

我从网上获得了以下代码,但会引发错误。raw_comp_name包含来自csv的数据。raw_comp_name.encode(encoding='utf-8').decode('ascii')

信息


日语字符具有以下标准。双字节字符的宽度是普通字母字符的两倍。

  • 双字节字符(全角Zenkaku)
  • 单字节字符(半角半角) 在此处输入图片说明

您可以从此链接获取更多详细信息

回答


您可以使用此jaconv | 模块。它具有单字节到双字节以及双字节到单字节功能。从模块文档链接中查看更多详细信息

随附以下示例代码:

import jaconv

hankaku_text = '東京都中央区晴海1丁目8番11号'
converted_zenkaku = jaconv.hankaku2zenkaku(hankaku_text)
print(converted_zenkaku)

zenkaku_text = "ADORES,Inc."
converted_hankaku = jaconv.zenkaku2hankaku(zenkaku_text)
print(converted_hankaku)

output:
東京都中央区晴海1丁目8番11号
ADORES, Inc.

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何将字节数组转换为字符串,反之亦然?

如何将 AES 加密输出字节转换为字符串,反之亦然

如何使用高棉字符串将字符串转换为字节,反之亦然?

如何将字节数组转换为十六进制字符串,反之亦然?

将字符串转换为字节数组,反之亦然

如何将Netty ByteBuf转换为字符串,反之亦然

将单字节字符串(半角)转换为双字节(全角)

将密钥转换为字符串,反之亦然

如何将8字符字符串转换为64位bigint,反之亦然?

字节到字符串,反之亦然

AES-如何将字节字符串转换为字节字节字符串?

如何将浮点数组转换为单字节字符串?

如何将浮点数转换为字节数组,反之亦然?

如何将pandas DataFrame转换为字节,反之亦然?

从[] byte转换为字符串,反之亦然的开销

Java字符串转换为Json,反之亦然

识别字符串中的双字节字符并将其转换为单字节字符

如何将字符串转换为字节?

如何将字节字符串转换为int?

如何将字符串转换为字节并返回

将字节转换为 dart 中的位,反之亦然

将List <int>转换为字符串,反之亦然?

R - 将公式转换为字符串,反之亦然

将数据集转换为xml字符串,嵌套重复的xml反之亦然

将IP字符串转换为数字,反之亦然

将字符串转换为加密密钥,反之亦然

有几种方法可以将位图转换为字符串,反之亦然?

将小时分钟字符串时间转换为utc,反之亦然

将字符串时间转换为Unix时间,反之亦然