如何使用for循环遍历pandas dataframe列以基于给定的列表对值进行计数

用户名

我想使用for循环遍历pandas数据框的列，以基于给定的列表对值进行计数。

My_list =[ 'apple', 'orange', 'grapes' ]

我可以使用value_count()以下给出的函数来计算频率

df['Fruits']. value_count()

但我想使用for循环进行计算以遍历数据帧以获取给定列表的计数和平均值。

My_list =[ 'apple', 'orange', 'grapes' ] 

Df:   
    Fruits  value
    apple      10
    apple      20 
    orange      2
    grapes      5 
    grapes     10 
    grapes      3

我的输出应该是这样的。

Fruits    count    average
apple      2         15 
orange     1          2 
grapes     3          6

耶斯列尔

使用：

用query或过滤boolean indexing
groupby和聚合size和mean
通过重命名列名 dictionary
将索引转换为列 reset_index

My_list = ['apple', 'orange', 'grapes'] 
df1 = (df.query("Fruits in @My_list")
         .groupby('Fruits', sort=False)['value']
         .agg(['size','mean'])
         .rename(columns={'mean':'average', 'size':'count'})
         .reset_index())

df1 = (df[df['Fruits'].isin(My_list)]
        .groupby('Fruits', sort=False)['value']
        .agg(['size','mean'])
        .rename(columns={'mean':'average', 'size':'count'})
        .reset_index())

print (df1)
   Fruits  count  average
0   apple      2       15
1  orange      1        2
2  grapes      3        6

如果要使用循环，它应该更慢：

L = []
for x in My_list:
    s = df.loc[df['Fruits'] == x, 'value']
    #print (s)
    L.append({'Fruits': x, 'average':s.mean(), 'count':len(s)})

df = pd.DataFrame(L, columns=['Fruits','count','average'])
print (df)
   Fruits  count  average
0   apple      2     15.0
1  orange      1      2.0
2  grapes      3      6.0

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-22

我来说两句

0 条评论

登录后参与评论

上一篇：按一列将Pandas数据框分组，然后根据另一列删除行

给定输入值列表，如何计算 Python 中的 Pandas DataFrame 列的计数？

如何使用for循环遍历pandas dataframe列以基于给定的列表对值进行计数

如何使用for循环遍历pandas dataframe列以基于给定的列表对值进行计数

Linux的官方Adobe Flash存储库是否已过时？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

如何检查字符串输入的格式

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

Modbus Python施耐德PM5300

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

用日期数据透视表和日期顺序查询

检查嵌套列表中的长度是否相同

Java Eclipse中的错误13，如何解决？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

如何监视应用程序而不是单个进程的CPU使用率？

如何自动选择正确的键盘布局？-仅具有一个键盘布局

ES5的代理替代

在令牌内联程序集错误之前预期为 ')'

有什么解决方案可以将android设备用作Cast Receiver？

套接字无法检测到断开连接

如何在JavaScript中获取数组的第n个元素？

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

应用发明者仅从列表中选择一个随机项一次

在Windows 7中无法删除文件（2）

ggplot：对齐多个分面图-所有大小不同的分面