通过列值比较两个熊猫数据帧的行

沙宾娜(Shabina Rayan)

我有两个数据框,分别代表从两个不同的计步器中提取的数据,这些计步器记录了一个人在特定月份跑步了多少英里。

我想为DF 1和DF 2中具有相同的“月份”“人”的行计算“运行里程”中的差异例如,DF 1和DF 2具有Joe在1月跑过的里程和Bob在2月跑过的里程。对于这两个常见行,我想计算两者的“ Miles Run”有多不同。

任何想法如何从具有2个匹配列值的两个DF中提取行?

DF 1:

Month of Year   Miles Run   Person 
   January      6.7458      Joe 
   February     1.3808      Bob
   March        11.2689     Jill  
   April        9.8917      Sarah  

DF 2:

Month of Year   Miles Run   Person 
   November     5.5234      Andrew 
   December     7.4523      Kyle
   January      9.1189      Joe  
   February     7.4343      Bob
斯科特·波士顿

使用set_index并让熊猫使用内部数据对齐执行减法:

(DF1.set_index(['Month of Year','Person']) - DF2.set_index(['Month of Year','Person'])).fillna(0)

输出:

                      Miles Run
Month of Year Person           
April         Sarah      0.0000
December      Kyle       0.0000
February      Bob       -6.0535
January       Joe       -2.3731
March         Jill       0.0000
November      Andrew     0.0000

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

比较两个熊猫数据帧的行的最快方法?

比较两个熊猫数据帧的行?

熊猫数据框:比较两个相邻行的值并添加一列

逐行比较两个熊猫数据帧

比较两个熊猫数据帧中的值以保持运行计数

比较两个熊猫数据帧中的值,与顺序无关

比较来自不同数据帧的两个值,并基于熊猫中的添加值

比较两个熊猫数据帧的内容,即使行的顺序不同

比较两个熊猫数据帧上的所有列以获得差异

比较两个差异熊猫数据框上两列的值并返回最大值

如何通过比较值范围合并两个熊猫数据框(或传输值)

如何通过逐列相乘来组合两个不同的多索引熊猫数据帧

通过忽略熊猫数据框中的秒值来比较两个日期

比较因子变量的每个级别的数据帧的两个连续行的值 - Python Pandas

来自熊猫数据帧的两个时间值之间的行

如何根据行值组合两个长度不同的熊猫数据帧

熊猫比较两个不同长度的数据帧并将某些行分成两半

熊猫通过比较两个数据框创建一个新列

通过比较两个熊猫数据框创建一列

比较两个数据帧,并根据匹配的列值从df中删除行

仅某些行的两个大小不同的熊猫数据帧的列总和

熊猫在两个具有相同列的数据帧中减去值创建新的数据帧来存储结果

在熊猫中按行比较一个日期框架中的日期列值与另一个数据框架中的两个日期列

如何比较两个不同列之间的熊猫值?

比较两个不同的熊猫列中的值

比较列和行上的两个熊猫数据框

比较多列以获取两个熊猫数据框中不同的行

比较两个Spark数据帧

两个如何比较来自两个不同数据框的熊猫的两行