按流派绘制平均值；大熊猫

用户名

import numpy as np
df = df.dropna(subset=['genres']).reset_index(drop=True) 

splitted = df['genres'].str.split('|')  
l = splitted.str.len()

x = df['gross'] / df['budget']

df = pd.DataFrame({x: np.repeat(df[x], l), 'genres':np.concatenate(splitted)}) 



d = {'mean':'Average Income'}
df1 = df.groupby('genres')[x].agg(['mean']).rename(columns=d) 

df1.plot.bar() 

plt.yscale("log") 
plt.xlabel("Genre")

我想绘制多少个流派的每个“ x”的平均值（因为单个电影有多个流派，所以我将它们拆分为单个流派），但是我不确定我的代码有什么问题。这不是我想要的。我需要一些帮助。

这是错误消息

耶斯列尔

我认为如果需要聚合仅使用一个更常见的功能groupby+ mean：

import numpy as np

df = pd.DataFrame({'genres':['Comedy|Crime|Drama|Thriller','Comedy|Crime|Drama',
                   'Comedy|Crime','Drama|Thriller','Drama','Comedy|Crime'],
                   'gross':[10,20,30,40,50,60],
                   'budget':[3,4,5,3,2,5]})


df = df.dropna(subset=['genres']).reset_index(drop=True) 

splitted = df['genres'].str.split('|')  
l = splitted.str.len()

x = df['gross'] / df['budget']

#is necessary define new column name (divided) and change `df[]` to `x`  
df = pd.DataFrame({'divided': np.repeat(x, l), 'genres':np.concatenate(splitted)}) 
print (df)
      divided    genres
0    3.333333    Comedy
1    3.333333     Crime
2    3.333333     Drama
3    3.333333  Thriller
4    5.000000    Comedy
5    5.000000     Crime
6    5.000000     Drama
7    6.000000    Comedy
8    6.000000     Crime
9   13.333333     Drama
10  13.333333  Thriller
11  25.000000     Drama
12  12.000000    Comedy
13  12.000000     Crime

#define column for aggregate (divided), no x, because processing new df created by repeat 
d = {'mean':'Average Income'}
df1 = df.groupby('genres')['divided'].mean().rename(columns=d).reset_index(name='return')


df1.plot.bar(x='genres', y='return') 

plt.yscale("log") 
plt.xlabel("Genre")

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-12

我来说两句

0 条评论

登录后参与评论

获取大熊猫的每月平均值

按流派绘制平均值；大熊猫

按流派绘制平均值；大熊猫

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用