在熊猫的平均两个相同格式的数据帧

南美洲

我有两个从CSV文件加载的熊猫数据框。每列都有两列,列A是ID,并且在两个CSV中的值和顺序相同。B列是数值。

我需要创建一个新的CSV,其A列与前两个相同,B列为两个初始CSV的平均值。

我正在创建两个像

df1=pd.read_csv(path).set_index('A')
df2=pd.read_csv(otherPath).set_index('A')

如果我做

newDf = (df1['B'] + df2['B'])/2
newDf.to_csv(...)

那么newDF在A列中的ID顺序错误

如果我做

df1['B'] = (df1['B'] + df2['B'])/2
df1.to_csv(...)

我在第一行收到一个错误,提示“值错误:无法从重复的轴重新索引”

看来这应该是微不足道的,我在做什么错呢?

塞尔吉奥马希

尝试使用merge而不是设置索引。

即,我们有以下数据框:

df1 = pd.DataFrame({"A" : [1, 2, 3, 4, 5], "B": [3, 4, 5, 6, 7]})
df2 = pd.DataFrame({"A" : [1, 2, 3, 4, 5], "B": [7, 4, 3, 10, 23]})

然后,我们将它们合并,并用两个B列的平均值创建一个新列。

together = df1.merge(df2, on='A')
together.loc[:, "mean"] = (together['B_x']+ together['B_y']) / 2
together = together[['A', 'mean']]

和在一起是:

    A   mean
0   1   5.0
1   2   4.0
2   3   4.0
3   4   8.0
4   5   15.0

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

两个熊猫数据帧之间的平均向量

当两个熊猫数据帧包含相同的行但一个数据帧包含多个行时,查找两个熊猫数据帧之间的差异

从两个具有相同索引和列的熊猫数据帧执行计算的最快方法

如何在熊猫中减去两个相同的数据帧

熊猫在两个具有相同列的数据帧中减去值创建新的数据帧来存储结果

不同格式的两个相同日期给出不同的纪元时间

如何组合两个格式相同但长度索引不同的熊猫数据框

熊猫:我该如何迭代两个格式完全相同的数据框?

为两个熊猫数据帧设置等效的dtypes

在时间戳上加入两个熊猫数据帧

使用浮点索引合并两个熊猫数据帧

逐行比较两个熊猫数据帧

两个熊猫数据帧之间的快速Spearman相关

两个熊猫数据帧的相关矩阵

熊猫-合并两个未堆叠的数据帧

如何从两个不同的熊猫数据帧计算比率

两个熊猫数据帧的条件逐元素乘法

找出熊猫中两个不同数据帧的交集

如何关联两个熊猫数据帧的标量值

比较两个熊猫数据帧的行的最快方法?

比较两个熊猫数据帧的行?

迭代两个长度相同的数据帧

循环并绘制两个相同数据帧的列

比较不同格式的两个日期

如何比较两个不同格式的日期?

如何从两个具有相同格式的Excel工作表中找出不同的单元格

从两个数据帧计算一个新的熊猫数据帧

如何在 R 中创建一个函数来比较数据帧的连续偶数行和奇数行并返回相同格式的数据帧?

熊猫:两个日期之间选择从熊猫数据帧的所有数据