熊猫groupby到新专栏

Milano 发表于 Dev

米兰诺

我有一个包含列code和的数据框images。

列images是urls由逗号连接的字符串：<URL>,<URL2>,...

列code不是唯一的，我需要使其唯一，但是将所有图像（来自所有变体）存储在新列中images_all。

例如：

code something images
1    x         url1,url2,url3
1    x         url1,url4

结果是：编写一些images_all 1 x url1，url2，url3，url4的代码

我做了

grouped = csv.groupby('code')
csv = csv.drop_duplicates(subset=['code'], keep='last')
csv['images_all'] = csv.apply(lambda r:  list(set(
    [image for image in grouped.get_group(r['code'])['images']]
)))

引起：

KeyError: 'code'

但是，即使没有提出这个建议，问题仍然是图像不会出现[url1,url2,url3,url4]。相反，它将是["url1,url2,url3","url1,url4"]。

你知道如何解决吗？

编辑

我还想保留其他列（对于具有相同代码的所有行，它们都是相同的，这就是为什么我然后只需要drop_duplicates并保留最后一行）

耶斯列尔

GroupBy.transform与自定义函数一起使用，用于展平拆分的值，然后转换为集合和最后一个join唯一值：

f = lambda x: ','.join(set([z for y in x for z in y.split(',')]))
df['images_all'] = df.groupby('code')['images'].transform(f)
print (df)
   code something          images           images_all
0     1         x  url1,url2,url3  url1,url3,url2,url4
1     1         x       url1,url4  url1,url3,url2,url4

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-25

我来说两句

0 条评论

登录后参与评论

上一篇：classList的JavaScript问题

熊猫groupby到新专栏

熊猫groupby到新专栏

构建类似于Jarvis的本地语言应用程序

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

SQL Server中的非确定性数据类型

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

Swift 2.1-对单个单元格使用UITableView

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

HttpClient中的角度变化检测

如何了解DFT结果

错误：找不到存根。请确保已调用spring-cloud-contract：convert

Embers js中的更改侦听器上的组合框

在Wagtail管理员中，如何禁用图像和文档的摘要项？

如何避免每次重新编译所有文件？

Java中的循环开关案例

ng升级性能注意事项

Swift中的指针替代品？

如何使用geoChoroplethChart和dc.js在Mapchart的路径上添加标签或自定义值？

使用分隔符将成对相邻的数组元素相互连接

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

ggplot：对齐多个分面图-所有大小不同的分面

完全禁用暂停（在内核级别？-必须与使用的DE和登录状态无关！）