熊猫集团

不成对的好

我遇到了麻烦。假设我有以下示例贷款数据帧：

test_df = pd.DataFrame({'name': ['Jack','Jill','John','Jack','Jill'],
                   'date': ['2016-08-08','2016-08-08','2016-08-07','2016-08-08','2016-08-08'],
                   'amount': [1000.0,1500.0,2000.0,2000.0,3000.0],
                   'return_amount': [5000.0,2000.0,3000.0,0.0,0.0],
                   'return_date': ['2017-08-08','2017-08-08','2017-08-07','','2017-08-08']})

test_df.head()

    amount  date        name    return_amount   return_date
0   1000.0  2016-08-08  Jack    5000.0          2017-08-08
1   1500.0  2016-08-08  Jill    2000.0          2017-08-08
2   2000.0  2016-08-07  John    3000.0          2017-08-07
3   2500.0  2016-08-08  Jack    0.0
4   2500.0  2016-08-08  Jill    0.0             2017-08-08

按名称对这个数据框进行分组（按人分组贷款）之后，我需要执行一些操作：

1）return amount需要由的和按比例分配amount。

2）如果return date缺少给定人的任何贷款，则所有return_dates应转换为空字符串”。

我已经有一个用于分配比例回报金额的函数：

def allocate_return_amount(group):
    loan_amount = group['amount']
    return_amount = group['return_amount']
    sum_amount = loan_amount.sum()
    sum_return_amount = return_amount.sum()
    group['allocated_return_amount'] = (loan_amount/sum_amount) * sum_return_amount
    return group

而且我grouped_test_df = grouped_test_df.apply(allocate_return_amount)经常使用它。

我正在苦苦挣扎的是我需要执行的第二项操作，检查某人的任何贷款是否缺失return_date，如果存在，则return_dates将该人的所有借项更改为。

我已经在pandas文档中找到GroupBy.all ，但是我还没有弄清楚如何使用它，有经验的人吗？

由于此示例可能很难遵循，因此这是此示例的理想输出：

ideal_test_df.head()

    amount  date        name    return_amount   return_date
0   1000.0  2016-08-08  Jack    0.0             ''
1   1500.0  2016-08-08  Jill    666.66          2017-08-08
2   2000.0  2016-08-07  John    3000.0          2017-08-07
3   2500.0  2016-08-08  Jack    0.0             ''
4   2500.0  2016-08-08  Jill    1333.33         2017-08-08

希望这是有道理的，在此先感谢所有花时间帮助我的熊猫专家！

杰夫

您可以通过遍历各组，使用来测试条件any，然后使用设置回原始数据框来做到这一点loc：

test_df = pd.DataFrame({'name': ['Jack','Jill','John','Jack','Jill'],
                   'date': ['2016-08-08','2016-08-08','2016-08-07','2016-08-08','2016-08-08'],
                   'amount': [1000.0,1500.0,2000.0,2000.0,3000.0],
                   'return_amount': [5000.0,2000.0,3000.0,0.0,0.0],
                   'return_date': ['2017-08-08','2017-08-08','2017-08-07','','2017-08-08']})

grouped = test_df.groupby('name')

for name, group in grouped:
    if any(group['return_date'] == ''):
        test_df.loc[group.index,'return_date'] = ''

而且，如果您也想重置return_amount，并且不介意额外的开销，只需在下面添加此行：

test_df.loc[group.index, 'return_amount'] = 0

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-3

我来说两句

0 条评论

登录后参与评论

集团通过在数据帧大熊猫日期和计数值在嵌套的字典值

熊猫集团的绘图结果

熊猫集团并获得假人

熊猫集团总营业额

熊猫集团按指数

熊猫集团按列名

熊猫集团

熊猫集团按价值频率

熊猫集团生产系列；不是groupby对象

从熊猫集团获得独特的价值记录

熊猫集团按条件连续经营

熊猫集团随后提出抛出警告

熊猫-集团的变化价值

熊猫集团的串联问题

熊猫集团

熊猫集团前外加入

熊猫合并和集团联合

在熊猫集团中满足条件的数量增加

熊猫集团通过计算满足一定条件的加权百分比

熊猫集团然后滚动和求和得到错误的结果

Ewan熊猫集团

熊猫集团通过总和图-可以同时完成吗？

熊猫集团按日期每周

熊猫集团六个月

用第一行值替换每个组中的行。熊猫集团

熊猫集团通过不填写缺失数据

证明任何大小为n的小集团的最小顶点覆盖都必须恰好具有n-1个顶点

熊猫集团除以马克斯

TOP 榜单

文章

熊猫集团

熊猫集团

蓝屏死机没有修复解决方案

计算数据帧中每行的NA

UITableView的项目向下滚动后更改颜色，然后快速备份

Node.js中未捕获的异常错误，发生调用

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Linux的官方Adobe Flash存储库是否已过时？

验证REST API参数

ggplot：对齐多个分面图-所有大小不同的分面

Mac OS X更新后的GRUB 2问题

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

带有错误“ where”条件的查询如何返回结果？

用日期数据透视表和日期顺序查询

VB.net将2条特定行导出到DataGridView

如何从视图一次更新多行（ASP.NET - Core）

Java Eclipse中的错误13，如何解决？

尝试反复更改屏幕上按钮的位置 - kotlin android studio

离子动态工具栏背景色

应用发明者仅从列表中选择一个随机项一次

当我尝试下载 StanfordNLP en 模型时，出现错误

python中的boto3文件上传

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID