所以我本质上已经明白了。.csv文件:
,year,team,tr_diff,ranking
0,2010,ADO Den Haag,3.9473684210526314,N/A
1,2011,ADO Den Haag,1.5120274914089347,N/A
2,2012,ADO Den Haag,-1.2320328542094456,N/A
3,2013,ADO Den Haag,-3.757828810020877,N/A
这是我的代码:
rankings = [('ADO Den Haag', 12, 2010), ('ADO Den Haag', 16, 2011), .... ('ADO Den Haag', 12, 2013)]
df = pd.read_csv('preliminary.csv')
for tuple in rankings:
df.loc[(df['team'] == tuple[0]) & (df['year'] == tuple[2]), 'ranking'] = tuple[1]
目标是找到一列具有正确的团队名称和年份的列,并在“ Ranking”列的该行中添加可以在元组的第二项中找到的排名。我怎样才能做到这一点?这段代码不会引发任何错误,但不能满足我的要求。我希望的行为是这样。
,year,team,tr_diff,ranking
0,2010,ADO Den Haag,3.9473684210526314,12
1,2011,ADO Den Haag,1.5120274914089347,16
2,2012,ADO Den Haag,-1.2320328542094456,14
3,2013,ADO Den Haag,-3.757828810020877,15
4,2014,ADO Den Haag,2.5974025974025974,11
5,2015,ADO Den Haag,3.4702549575070822,8
6,2016,ADO Den Haag,-4.3626448534424,12
我究竟做错了什么?
您不需要遍历元组列表。使用.merge()代替。假设您rankings
的每个条目都有一个条目,df
您需要:
ranking_df = pd.DataFrame(rankings, columns=['team', 'ranking', 'year'])
new_df = df.drop(['ranking'], axis=1).merge(ranking_df, on=['team', 'year'], how='left')
输入:
year team tr_diff ranking
0 2010 ADO Den Haag 3.947368 NaN
1 2011 ADO Den Haag 1.512027 NaN
2 2012 ADO Den Haag -1.232033 NaN
3 2013 ADO Den Haag -3.757829 NaN
输出:
year team tr_diff ranking
0 2010 ADO Den Haag 3.947368 12.0
1 2011 ADO Den Haag 1.512027 16.0
2 2012 ADO Den Haag -1.232033 NaN
3 2013 ADO Den Haag -3.757829 NaN
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句