如何使用熊猫将CSV文件读取到数据帧

贾米

我刚得到一个csv文件,我想使用熊猫将数据集加载为dataframe。但是,我有点混淆了这种数据格式。

这是两行数据的示例:

Name=John, Gender=M, BloodType=A, Location=New York, Age=18
Name=Mary, Gender=F, BloodType=AB, Location=Seatle, Age=30

如何将此数据集加载到具有列(名称,性别,BloodType等)的数据框中?

我将不胜感激,有人会给我提示!

耶斯列尔

使用read_csvheader=None第一:

import pandas as pd

temp=u"""Name=John,Gender=M,BloodType=A,Location=New York,Age=18
Name=Mary,Gender=F,BloodType=AB,Location=Seatle,Age=30"""
#after testing replace 'pd.compat.StringIO(temp)' to 'filename.csv'
df = pd.read_csv(pd.compat.StringIO(temp), header=None)
print (df)
           0         1             2                  3       4
0  Name=John  Gender=M   BloodType=A  Location=New York  Age=18
1  Name=Mary  Gender=F  BloodType=AB    Location=Seatle  Age=30

然后DataFrame.apply使用Series.str.split并选择第二个列表,最后更改列名称:

df1 = df.apply(lambda x: x.str.split('=').str[1])
df1.columns = df.iloc[0].str.split('=').str[0].rename(None)
#if necessary
df1['Age'] = df1['Age'].astype(int)
print (df1)
   Name Gender BloodType  Location  Age
0  John      M         A  New York   18
1  Mary      F        AB    Seatle   30

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

将csv文件读取到熊猫失败

Pyspark将多个csv文件读取到一个数据帧中(或RDD?)

将csv文件作为浮点数读取到pandas数据帧

使用唯一的分隔符和行尾将txt文件读取到pandas数据帧

如何将具有多个标题行的csv文件读取到熊猫中?

如何将多个CSV文件从文件夹读取到以数据框名称作为文件名的熊猫中

如何将文本文件读取到数组成熊猫数据框

使用多个定界符有效地将数据从CSV读取到数据帧中

在执行csv读取时将熊猫数据帧头移到

将多个csv文件读取到Pandas数据框中

将csv读取到保留原样的熊猫

如何将csv文件数据读取到数组中?

如何将csv文件读取到numpy ndarrays

将大熊猫数据帧分块写入CSV文件

使用python将数据文件读取到数组

如何将熊猫数据帧一行一行地写入CSV文件?

如何使用Python将文本文件中的数据读取到数组中

将 csv 读取到数据帧时忽略/删除一些行

从S3将压缩的csv读取到python数据帧中

在将数据帧写入/读取到CSV时出现问题-最终形状-Python

将多个csv读取到pandas中的多个数据帧中

如何使用python将.csv文件中的行数据提取到单独的.txt文件中?

将 csv 文件作为数据帧读取时模式错误

从HDFS将CSV文件读取为数据帧

将本地文件读取到在Docker容器上运行的Zeppelin中的spark数据帧中

从目录和子目录将文件读取到pyspark数据帧中

将多个表从一个 tsv 文件读取到 R 数据帧

将CSV数据读取到Matlab

将CSV文件读取到字典