解析數據框中的字典列表

未來數據工程師

這是一個數據框示例（實際上它有更多的列，：

	_ID	答案	額外的列
0	一種	[{'title': 'dog', 'value': 'True'}, {'title': 'cat', 'value': 'False'}, {'title': 'bird', 'value': '錯誤的'}]	某物
1	乙	[{'title': 'food', 'value': 'False'}, {'title': 'water', 'value': 'True'}, {'title': 'wine', 'value': '錯誤的'}]	沒有
2	C	[]	[]
3	d	[]	22

我想添加一個額外的列來表示鍵的總字符串長度。因此，對於第一行，它將是 10（“狗”+“貓”+“鳥”），然後是 13，然後是 0，然後是 0。

我試過了，parsed = df.groupby('_id').answers.apply(lambda x: pd.DataFrame(df.values[0])).reset_index()但它完全弄亂了我的數據集，並以某種方式解析了我的額外列。我正在考慮從這些字典中創建一個額外的數據框，並像df['Length']=df['title'].str.len(). 那可能嗎？

穆罕默德·哈桑

嘗試：

df = df.join(df['answers'].explode().apply(pd.Series)['title'])
df['extraColumn'] = df.groupby('_id')['title'].transform(lambda x: len(x.str.cat(sep='')))
df.drop_duplicates(subset=['_id'], inplace=True)

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-10-5

我来说两句

0 条评论

登录后参与评论

上一篇：SyntaxError ：意外的令牌不断弹出

列表中的幾個字典到數據框的列

更新字典中的數據框

使用列表和數據框從 a 創建字典

嵌套字典中數據框中的多列更新

解析數據框中的字典列表

解析數據框中的字典列表

Android Studio Kotlin：提取为常量

IE 11中的FormData未定义

计算数据帧R中的字符串频率

如何在R中转置数据

如何使用Redux-Toolkit重置Redux Store

Excel 2016图表将增长与4个参数进行比较

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

未捕获的SyntaxError：带有Ajax帖子的意外令牌u

OpenCv：改变 putText() 的位置

ActiveModelSerializer仅显示关联的ID

算术中的c ++常量类型转换

如何开始为Ubuntu开发

将加号/减号添加到jQuery菜单

去噪自动编码器和常规自动编码器有什么区别？

获取并汇总所有关联的数据

OpenGL纹理格式的颜色错误

在 React Native Expo 中使用 react-redux 更改另一个键的值

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

TreeMap中的自定义排序

Redux动作正常，但减速器无效

如何对treeView的子节点进行排序