将带有列的大熊猫DF列到文件中，如何将其读回？

什里什·库尔哈里（Shirish Kulhari）

假设我有一个数据框，其中的一个列由列表填充，如下所示：

    c1    c2

0  "asd"  ["el1", "el2"]

1  "sdf"  ["el1", "el3", "el5"]

通过to_csv函数将其写入到csv中，自然会将列表输出为字符串。read_csv例如，当我再次通过读取文件时，第一个列表将被读取为"[el1, el2]"而不是预期的["el1", "el2"]。因此，如果我运行split命令，则预期的输出是，"el1", "el2"但是我得到的却是"[", "e", "l", "1", ",", "e", "l", "2", "]"。

我该如何规避？如何干净地编写和读取熊猫数据框的列表列？

耶斯列尔

您可以使用转换列表填充的列ast.literal_eval：

import ast

df['c2'] = df['c2'].apply(ast.literal_eval)
print (df)
    c1               c2
0  asd       [el1, el2]
1  sdf  [el1, el3, el5]

另一个想法是使用converters在read_csv与拉姆达功能ast.literal_eval：

import ast
from io import StringIO

temp="""c1;c2
"asd";["el1", "el2"]
"sdf";["el1", "el3", "el5"]"""
#after testing replace 'pd.compat.StringIO(temp)' to 'filename.csv'
con = lambda x: ast.literal_eval(x)
df = pd.read_csv(StringIO(temp), sep=';', converters = {'c2':con})

print (df)
    c1               c2
0  asd       [el1, el2]
1  sdf  [el1, el3, el5]

如果写数据到CSV，总是被conveterted为字符串，为避免有可能使用另一种格式，如泡菜和使用DataFrame.to_pickle有read_pickle：

df.to_pickle('file.pkl')

df = pd.read_pickle('file.pkl')
print (df)
    c1               c2
0  asd       [el1, el2]
1  sdf  [el1, el3, el5]

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-21

我来说两句

0 条评论

登录后参与评论

上一篇：如何在通用Lisp中递归地添加列表？

如何将带有多个标头的CSV文件读入大熊猫中的两个DataFrame中，一个带标头，一个带某些标头的数据？

大熊猫中的列表列到元组列

大熊猫将带有元组的数据框列扩展为多个列和行

如何将大熊猫列分为带有字符串和整数的两列

将带有字典的大熊猫列表类型列映射为两个最大值

计算大熊猫DataFrame中带有NaN的行数？

大熊猫切片在列中带有冒号

大熊猫：如何将数据框的所有数字列转换为对数

批处理：如何将带有特殊字符的set / p回显到文件中？

大熊猫的行程将列的类型更改为浮动。如何将其转换回原始类型？

从带有嵌套词典的大熊猫

如何检查日期列在特定月份的大熊猫中？

在大熊猫中，应该如何添加年龄范围列？

如何在没有聚合功能的大熊猫中对列进行分组？

如何将包含垃圾桶的熊猫数据帧写入文件，以便可以将其读回熊猫？

获取有关每一行的统计信息并将其放入新列中。大熊猫

如何转用大熊猫完整的文件

如何将带有很多注释行的数据文本文件加载到熊猫中？

合并大熊猫中的列？

列与字典中的大熊猫？

大熊猫从列中删除值

融化大熊猫中的分类列

大熊猫中列的条件求和

PANDAS：将带有日期时间索引的大熊猫系列切入过去的n行

如何将某些内容保存到列中并将其读回对象

如何在大熊猫中阅读带有空单元格的漂亮印刷表？

大熊猫分配列值取决于df中的另一列

如何量化大熊猫中的数据？

在大熊猫中如何调用函数

TOP 榜单

文章

将带有列的大熊猫DF列到文件中，如何将其读回？

将带有列的大熊猫DF列到文件中，如何将其读回？

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用