python pandas将数据框转换为所需字典的数组

呼吸

[编辑]

我有以下方式的数据框

ID      , EmailID    , First Name, Last Name, Gender, DOB
1       , [email protected]  , One First , One Last , M     , 11-13-1920
2       , [email protected]  , Two First , Two Last , M     , 11-13-1920
3       , [email protected]  , Thr First , Thr Last , M     , 11-13-1920
4       , [email protected]  , Fou First , Fou Last , M     , 11-13-1920
5       , [email protected]  , Fiv First , Fiv Last , M     , 11-13-1920
6       , [email protected]  , Six First , Six Last , M     , 11-13-1920

我想要下面想要的

[
   {"_id" : "[email protected]", "_souce" : {"ID": 1, "EmailID" : "[email protected]", "data" : "{'ID':'1', 'EmailID': '[email protected]', 'First Name' : 'One First', 'Last Name' : 'One First', 'Gender': 'M', 'DOB': '11-13-1920'}"}},
   {"_id" : "[email protected]", "_souce" : {"ID": 2, "EmailID" : "[email protected]", "data" : "{'ID':'2', 'EmailID': '[email protected]', 'First Name' : 'Two First', 'Last Name' : 'Two First', 'Gender': 'M', 'DOB': '11-13-1920'}"}},
   {"_id" : "[email protected]", "_souce" : {"ID": 3, "EmailID" : "[email protected]", "data" : "{'ID':'3', 'EmailID': '[email protected]', 'First Name' : 'The First', 'Last Name' : 'The First', 'Gender': 'M', 'DOB': '11-13-1920'}"}},
   {"_id" : "[email protected]", "_souce" : {"ID": 4, "EmailID" : "[email protected]", "data" : "{'ID':'4', 'EmailID': '[email protected]', 'First Name' : 'Fou First', 'Last Name' : 'Fou First', 'Gender': 'M', 'DOB': '11-13-1920'}"}},
   {"_id" : "[email protected]", "_souce" : {"ID": 5, "EmailID" : "[email protected]", "data" : "{'ID':'5', 'EmailID': '[email protected]', 'First Name' : 'Fiv First', 'Last Name' : 'Fiv First', 'Gender': 'M', 'DOB': '11-13-1920'}"}},
   {"_id" : "[email protected]", "_souce" : {"ID": 6, "EmailID" : "[email protected]", "data" : "{'ID':'6', 'EmailID': '[email protected]', 'First Name' : 'Six First', 'Last Name' : 'Six First', 'Gender': 'M', 'DOB': '11-13-1920'}"}}
]

我怎样才能有效地做到这一点？我应该循环并通过它或通过熊猫制作另一个数组吗

转换后的字典应具有

_id与ID和EmailID的组合
_source应该具有以下信息；
1. 所有信息转换为json字符串的数据
2. 在同一字典中具有ID，EmailID

耶斯列尔

将所有行转换为jsons转换为新列，然后添加_id列，按预期顺序将最后设置的列按字典顺序排序DataFrame.to_dict：

df['data'] = df.apply(lambda x: x.to_json(), axis=1)
df['_souce'] = df[['ID','EmailID','data']].apply(lambda x: x.to_dict(), axis=1)
df['_id'] =  df['ID'].astype(str)+ '-' + df['EmailID'].astype(str)
d = df[['_id','_souce']].to_dict(orient='records')

print (d)

[{
    '_id': '[email protected]',
    '_souce': {
        'ID': 1,
        'EmailID': '[email protected]',
        'data': '{"ID":1,"EmailID":"[email protected]","First Name":"One First","Last Name":"One Last","Gender":"M","DOB":"11-13-1920"}'
    }
}, {
    '_id': '[email protected]',
    '_souce': {
        'ID': 2,
        'EmailID': '[email protected]',
        'data': '{"ID":2,"EmailID":"[email protected]","First Name":"Two First","Last Name":"Two Last","Gender":"M","DOB":"11-13-1920"}'
    }
}, {
    '_id': '[email protected]',
    '_souce': {
        'ID': 3,
        'EmailID': '[email protected]',
        'data': '{"ID":3,"EmailID":"[email protected]","First Name":"Thr First","Last Name":"Thr Last","Gender":"M","DOB":"11-13-1920"}'
    }
}, {
    '_id': '[email protected]',
    '_souce': {
        'ID': 4,
        'EmailID': '[email protected]',
        'data': '{"ID":4,"EmailID":"[email protected]","First Name":"Fou First","Last Name":"Fou Last","Gender":"M","DOB":"11-13-1920"}'
    }
}, {
    '_id': '[email protected]',
    '_souce': {
        'ID': 5,
        'EmailID': '[email protected]',
        'data': '{"ID":5,"EmailID":"[email protected]","First Name":"Fiv First","Last Name":"Fiv Last","Gender":"M","DOB":"11-13-1920"}'
    }
}, {
    '_id': '[email protected]',
    '_souce': {
        'ID': 6,
        'EmailID': '[email protected]',
        'data': '{"ID":6,"EmailID":"[email protected]","First Name":"Six First","Last Name":"Six Last","Gender":"M","DOB":"11-13-1920"}'
    }
}]

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-26

我来说两句

0 条评论

登录后参与评论

上一篇：用茉莉花模拟if / else语句-使用Angular / Typescript进行单元测试

将数组的Python字典转换为数据框

将python字典列表转换为pandas中的数据框

python pandas将数据框转换为所需字典的数组

python pandas将数据框转换为所需字典的数组

Linux的官方Adobe Flash存储库是否已过时？

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

错误：“ javac”未被识别为内部或外部命令，

Modbus Python施耐德PM5300

为什么Object.hashCode（）不遵循Java代码约定

如何正确比较 scala.xml 节点？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

在令牌内联程序集错误之前预期为 ')'

数据表中有多个子行，asp.net核心中来自sql server的数据

VBA 自动化错误：-2147221080 (800401a8)

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

如何在JavaScript中获取数组的第n个元素？

检查嵌套列表中的长度是否相同

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

ES5的代理替代

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

如何监视应用程序而不是单个进程的CPU使用率？

如何检查字符串输入的格式

解决类Koin的实例时出错

如何自动选择正确的键盘布局？-仅具有一个键盘布局