我有在jupyter中阅读的excel文件。
它包含三列:1)网络研讨会ID:(66个唯一值)2)电子邮件:参与者的电子邮件ID(可以注销会话并再次加入,因此具有相同网络研讨会ID的重复电子邮件ID)3)会话时间(分钟):参与者正在参加会话,因为他可能会注销并再次登录,所以有多个条目。
使用的代码:data_group = data.groupby(['Webinar ID','Email'])
data_group ['会话时间(分钟)']。sum()
我想在Excel中创建新列,并在会话(分钟)信息中存储相同的时间总和 - 网络研讨会ID和电子邮件
谢谢!!
IIUC,您希望创建一个新列,其中包含每个网络研讨会组和电子邮件的时间总和。
让我们用groupby
用transform
:
data['Sum Session Minutes'] = (data.groupby(['Webinar ID','Email'])['Time in Session (minutes)']
.transform('sum'))
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句