我有一个代码用大熊猫连接2个数据框并求和。问题是我不想求和'Fecha'
,'hours'
因为如您在示例中所看到的,我有一行包含所有值,并且我想在那里有一个空行!
df = pd.read_csv('a_AR.csv')
df1 = pd.read_csv('a_US.csv')
frames = [df1, df]
result = pd.concat(frames)
result = result.sort_values(by=['Fecha','hours'])
del result['eCPM']
del result['Importe_a_pagar_a_medio']
result.loc['Total']= result.sum()
result.to_csv('a_AR-US_Days_hours.csv', index=False)
os.remove('a_US.csv')
os.remove('a_AR.csv')
结果示例:
Fecha,hours,impressions,revenue
22/01/2018,23hs,1666,0.73
22/01/2018,23hs,67,0.02
00hs00hs01hs01hs02hs02hs03hs03...,01/01/201801/01/201801/01/201801/01...,1733,0.75
您需要difference
所有没有Fecha
和hours
要过滤的列:
cols = df.columns.difference(['Fecha','hours'])
另一个更具动态性的解决方案,select_dtypes
用于选择所有numeric
列:
cols = df.select_dtypes(np.number).columns
df.loc['Total']= df[cols].sum()
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句