从 Python 中的 csv 文件读取字符串时如何避免双重转义（\\）？

塞卡里卡

这是一个运行良好的测试代码：

x = "b'\x12'"
y = x[2:-1]
z = y.encode('raw_unicode_escape')
print (z, int.from_bytes(z, 'big'))

这给出了预期的结果：

b'\x12' 18

现在我想做同样的事情，除了将初始字符串存储在 csv 文件中：

我创建了一个test.csv包含以下内容的文件：
```
 name,value
 item,"b'\x12'"
```

我创建了一个改编的测试代码：

 import csv

 with open("test.csv", 'r') as csvfile:
     reader = csv.DictReader(csvfile)

     for row in reader:
         if row["name"] == "item":
             x = row["value"]

 print ("x:", x, type(x))
 y = x[2:-1]
 z = y.encode('raw_unicode_escape')
 print ("z:", z, int.from_bytes(z, 'big'))

这使：

x: b'\x12' <class 'str'>
z: b'\\x12' 1551380786

我应该怎么做才能避免双 \ 并获得与第一个测试代码相同的结果？

（目的是从该字节的文字 str 表示中获取实际字节，当文字 str 表示存储在 csv 文件中时）

乔兰·比斯利

ascii 编解码器不了解 \x## 编码，因此它成为文字 \ 后跟 x 后跟 2 个数字......文字 \ 在 python 中表示为 2 个反斜杠。

处理它的一种方法是使用 raw_unicode_escape 将其转换回字节，然后使用普通的 unicode_escape 将其转换回字符串

>>> s = "\\x12"
>>> type(s),repr(s)
(<class 'str'>, "'\\\\x12'")
>>> s_bytes=s.encode("raw_unicode_escape")|
>>> type(s_bytes),repr(s_bytes)
(<class 'bytes'>, "b'\\\\x12'")
>>> s2 = s_bytes.decode("unicode_escape")
type(s2),repr(s2)
(<class 'str'>, "'\\x12'")
>>> s2
'\x12'
>>> print(s2)

你也可以用正则表达式替换做这样的事情

import re
s = "\\x12"
s2 = re.sub(r"\\x(\d{2})",lambda m:chr(int(m.group(1),16)),s)

有很多方法可以解决这个问题，但这里有两种方法

但一般来说，使用 csv 存储二进制数据是一个坏主意.. 自己编码也可能不是最佳实践

您应该使用 base64 之类的东西将二进制数据转换为 ascii，或者在编写将表示 \x12 的文件时应该使用实际编码，但是您希望它被表示

如果真的保证它是一个简单的python对象的文字，你可以使用

import ast
a_byte_str = ast.literal_eval("b'\\x12'")
print(a_byte_str,a_byte_str[0])

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2022-05-25

我来说两句

0 条评论

登录后参与评论

从 Python 中的 csv 文件读取字符串时如何避免双重转义（\\）？

从 Python 中的 csv 文件读取字符串时如何避免双重转义（\\）？

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用