熊猫均值计算groupby 2列-如何忽略顺序？

瓦伦丁

假设我有一个包含3列的数据框：C1，C2和Value。我的C1和C2列都包含从0到3的值。

| C1 | C2 | Value |
|----|----|-------|
| 1  | 3  |   45  |
| 2  | 1  |  -50  |
| 3  | 1  |  200  |
| 1  | 2  |  -10  |
| 3  | 1  |   18  |
| 2  | 3  |    2  |
| 1  | 3  |   25  |

我想获取给定索引元组（x，y）的'value'列中值的平均值，其中C1中的x和C2中的y。但是，我想将元组（x，y）和（y，x）视为相同，即。没有考虑订购。我将尝试通过一个例子来阐明我的问题：假设C1 = 1且C1 = 3，在这种情况下，我想取平均值45、200、18和25。均以索引排序的数据框或序列。在上面的示例中，平均值为72。我想在结果中输入条目（1,3）和（3,1）的值都为72。（目标是能够绘制条形图的手段。）

我希望我的描述足够清楚。

我已经使用panda groupby运算符来找到方法，但是找不到如何处理订购问题。

这是我用于计算均值的代码：

python results = df.groupby(['C1','C2'])['value'].mean()

我必须对两个排序都取平均值，然后将结果保存回两个元组排序，但是我找不到合适的方法来做到这一点。谢谢你的帮助！

IIUC，您可以使用np.sort()overaxis=1和groupby对df进行排序：

m=pd.DataFrame(np.sort(df[['C1','C2']],axis=1),columns=['C1','C2']).join(df[['Value']])
m.groupby(['C1','C2']).Value.mean()

C1  C2
1   2    -30
    3     72
2   3      2
Name: Value, dtype: int64

print(m)

   C1  C2  Value
0   1   3     45
1   1   2    -50
2   1   3    200
3   1   2    -10
4   1   3     18
5   2   3      2
6   1   3     25

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-11

我来说两句

0 条评论

登录后参与评论

TOP 榜单

文章

熊猫均值计算groupby 2列-如何忽略顺序？

熊猫均值计算groupby 2列-如何忽略顺序？

构建类似于Jarvis的本地语言应用程序

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

SQL Server中的非确定性数据类型

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

Swift 2.1-对单个单元格使用UITableView

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

HttpClient中的角度变化检测

如何了解DFT结果

错误：找不到存根。请确保已调用spring-cloud-contract：convert

Embers js中的更改侦听器上的组合框

在Wagtail管理员中，如何禁用图像和文档的摘要项？

如何避免每次重新编译所有文件？

Java中的循环开关案例

ng升级性能注意事项

Swift中的指针替代品？

如何使用geoChoroplethChart和dc.js在Mapchart的路径上添加标签或自定义值？

使用分隔符将成对相邻的数组元素相互连接

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

ggplot：对齐多个分面图-所有大小不同的分面

完全禁用暂停（在内核级别？-必须与使用的DE和登录状态无关！）