假设我有以下数据集
table = [[datetime.datetime(2015, 3, 31), 1, 0.5, 1],
[datetime.datetime(2015, 6, 30), 1, 0.5, 0.5],
[datetime.datetime(2015, 9, 30), 1, 0.5, 0.5],
[datetime.datetime(2015, 12, 31), 1, 2, 0.5],
[datetime.datetime(2015, 3, 31), 2, 0.5, 1.5],
[datetime.datetime(2015, 6, 30), 2, 0.5, 0.5],
[datetime.datetime(2015, 9, 30), 2, 0.5, 0.5],
[datetime.datetime(2015, 12, 31), 2, 2, 0.5]]
df = pd.DataFrame(table, columns=['Date', 'Id', 'Value', 'Old'])
如果of的元素小于in的元素,是否可以将of的第一个元素更改为Value
对应的元素?它需要由每个小组(基于)来完成。因此,我的新桌子看起来像Old
Value
Old
Id
Date Id Value Old
0 2015-03-31 1 1.0 1.0
1 2015-06-30 1 0.5 0.5
2 2015-09-30 1 0.5 0.5
3 2015-12-31 1 2.0 0.5
4 2015-03-31 2 1.5 1.5
5 2015-06-30 2 0.5 0.5
6 2015-09-30 2 0.5 0.5
7 2015-12-31 2 2.0 0.5
谢谢,廷吉斯
由于您只想更改每个组的第一个元素,因此可以执行自定义的groupby apply功能。
import pandas as pd
import datetime
# your data
# =================================================
table = [[datetime.datetime(2015, 3, 31), 1, 0.5, 1],
[datetime.datetime(2015, 6, 30), 1, 0.5, 0.5],
[datetime.datetime(2015, 9, 30), 1, 0.5, 0.5],
[datetime.datetime(2015, 12, 31), 1, 2, 0.5],
[datetime.datetime(2015, 3, 31), 2, 0.5, 1.5],
[datetime.datetime(2015, 6, 30), 2, 0.5, 0.5],
[datetime.datetime(2015, 9, 30), 2, 0.5, 0.5],
[datetime.datetime(2015, 12, 31), 2, 2, 0.5]]
df = pd.DataFrame(table, columns=['Date', 'Id', 'Value', 'Old'])
print(df)
Date Id Value Old
0 2015-03-31 1 0.5 1.0
1 2015-06-30 1 0.5 0.5
2 2015-09-30 1 0.5 0.5
3 2015-12-31 1 2.0 0.5
4 2015-03-31 2 0.5 1.5
5 2015-06-30 2 0.5 0.5
6 2015-09-30 2 0.5 0.5
7 2015-12-31 2 2.0 0.5
# processing
# ====================================
def func(group):
if group.Value.values[0] < group.Old.values[0]:
group.Value.values[0] = group.Old.values[0]
return group
df.groupby('Id').apply(func)
Date Id Value Old
0 2015-03-31 1 1.0 1.0
1 2015-06-30 1 0.5 0.5
2 2015-09-30 1 0.5 0.5
3 2015-12-31 1 2.0 0.5
4 2015-03-31 2 1.5 1.5
5 2015-06-30 2 0.5 0.5
6 2015-09-30 2 0.5 0.5
7 2015-12-31 2 2.0 0.5
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句