我有两个CSV文件。一个称为“ master_registry.csv”,另一个称为“ master_reference.csv”。这两个CSV文件都有一个名为“ Master_Id”的列。我已经从“ master_registery.csv”中过滤了一些值,包括“ Master_Id”,并创建了名为“ df”的新数据框,还从“ master_reference.csv”中过滤了一些值,包括“ Master_Id”,并创建了一个新的数据框, df2”。因此,这两个数据帧都具有“ Master_Id”列。现在,我想通过组合“ df”和“ df2”数据帧来创建新的数据帧。有人可以帮我吗?
# reading CSV from the directory
master_registry = pd.read_csv('application/master_registry.csv')
master_reference = pd.read_csv('application/master_registry.csv')
# filtering some selected columns form the csv
df = master_registry .filter(items=['Master_ID', 'Provider First Name', 'Provider Last Name (Legal Name)', 'Provider Credential Text', 'Provider Gender Code','Provider License Number State Code_1',
'Provider Business Practice Location Address City Name'])
df2 = master_reference .filter(items=['Master_ID', 'Client_Reference_ID'])
使用join方法。以下用法-
df.set_index('Master_ID').join(df2.set_index('Master_ID'))
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句