鉴于我有以下两个熊猫DataFrame
:
df1 = pd.DataFrame({'A':['a', 'b', 'c'], 'B':[1,2,3]})
df2 = pd.DataFrame({'A':['d', 'e', 'f'], 'C':[4,5,6]})
之间有什么区别
df1.merge(df2, how='outer')
和
df1.append(df2)
尽管DataFrame
在两种情况下结果都是相同的,尽管on可以合并在任意列上,但我想知道在这种特定情况下使用一个相对于另一个是否有优势?
一个重要的区别是输出数据帧的索引。append
将保留原始索引,同时merge
重新分配新索引。看那个例子:
import pandas as pd
df = pd.DataFrame({"a": [1,2,3], "b": ["alpha", "beta", "gamma"]})
df2 = pd.DataFrame({"c": [4,5,6], "b": ["epsilon", "delta", "omega"]})
df.append(df2)
返回值:
a b c
0 1.0 alpha NaN
1 2.0 beta NaN
2 3.0 gamma NaN
0 NaN epsilon 4.0
1 NaN delta 5.0
2 NaN omega 6.0
而:
df.merge(df2, how="outer")
返回值:
a b c
0 1.0 alpha NaN
1 2.0 beta NaN
2 3.0 gamma NaN
3 NaN epsilon 4.0
4 NaN delta 5.0
5 NaN omega 6.0
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句