使用熊猫堆叠条形图

Gee 发表于 Dev

哎呀

我想以条形图的形式表示我的数据，如我的预期输出所示。

time,date,category
0,2002-05-01,2
1,2002-05-02,0
2,2002-05-03,0
3,2002-05-04,0
4,2002-05-05,0
5,2002-05-06,0
6,2002-05-07,0
7,2002-05-08,2
8,2002-05-09,2
9,2002-05-10,0
10,2002-05-11,2
11,2002-05-12,0
12,2002-05-13,0
13,2002-05-14,2
14,2002-05-15,2
15,2002-05-16,2
16,2002-05-17,2
17,2002-05-18,2
18,2002-05-19,0
19,2002-05-20,0
20,2002-05-21,1
21,2002-05-22,2
22,2002-05-23,0
23,2002-05-24,1
24,2002-05-25,0
25,2002-05-26,0
26,2002-05-27,0
27,2002-05-28,0
28,2002-05-29,1
29,2002-05-30,0

import pandas as pd
from datetime import datetime
import matplotlib.pyplot as plt

df = pd.read_csv('df.csv')
daily_category = df[['date','category']]
daily_category['weekday'] = pd.to_datetime(daily_category['date']).dt.day_name()
daily_category_plot = daily_category[['weekday','category']]

daily_category_plot[['category']].groupby('weekday').count().plot(kind='bar', legend=None)
plt.show()

但是，我收到以下错误

回溯（最后一次调用）：文件“day_plot.py”，第 10 行，在 daily_category_plot[['category']].groupby('weekday').count().plot(kind='bar', legend=None ) 文件“/home/..../.local/lib/python3.6/site-packages/pandas/core/frame.py”，第 6525 行，在 groupby dropna=dropna，文件“/home/... ./.local/lib/python3.6/site-packages/pandas/core/groupby/groupby.py”，第 533 行，在init dropna=self.dropna，文件“/home/..../.local/ lib/python3.6/site-packages/pandas/core/groupby/grouper.py"，第 786 行，在 get_grouper 中引发 KeyError(gpr) KeyError: 'weekday'

********** 下面的另一个示例，我在下面手动提取数据返回几乎预期的输出，除了日期表示为数字而不是工作日名称。***********

Day,category1,category2,category3
Sunday,0,0,4
Monday,0,0,4
Tuesday,1,1,2
Wednesday,1,4,0
Thursday,0,2,3
Friday,1,1,2
Saturday,0,2,2

import pandas as pd 
import numpy as np 
import matplotlib.pyplot as plt

df = pd.read_csv('df.csv')

ax = df.plot.bar(stacked=True, color=['green', 'red', 'blue'])
ax.set_xticklabels(labels=df.index, rotation=70, rotation_mode="anchor", ha="right")
ax.set_xlabel('')
ax.set_ylabel('Number of days')
plt.show()

测试输出

更新的代码产生奇怪的情节

import pandas as pd
from datetime import datetime
import matplotlib.pyplot as plt

df = pd.read_csv('df.csv')
daily_category = df[['time','date','category']]
daily_category['weekday'] = pd.to_datetime(daily_category['date']).dt.day_name()

ans = (daily_category.groupby(['weekday', 'category']) 
         .size()
         .reset_index(name='sum')
         .pivot(index='weekday', columns='category', values='sum')
      )

ans.plot.bar(stacked=True)
plt.show()

更新的输出

mosc9575

此解决方案使用groupbyon 列并使用pivot. 这可以绘制，plot.bar()但标签错误。因此，索引发生了变化。

我确实复制并过去了你的代码并得到了一个 DataFrame

import pandas as pd
from io import StringIO
t = """time,date,category
0,2002-05-01,2
..."""
df = pd.read_csv(StringIO(t))
df['weekday'] = df.date.apply(lambda x: pd.to_datetime(x).weekday())

要检查周三柱的预期输出，我使用过滤器选项。

>>>df[df['weekday']==2]
     time        date  category  weekday
0      0  2002-05-01         2        2
7      7  2002-05-08         2        2
14    14  2002-05-15         2        2
21    21  2002-05-22         2        2
28    28  2002-05-29         1        2

所以我想在星期三只看到第 1 类 (1/5) 和第 2 类 (4/5)。

ans = (df.groupby(["weekday", "category"]) 
         .size()
         .reset_index(name="sum")
         .pivot(index='weekday', columns='category', values='sum')
      )
ans.index = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday']
ans.plot.bar(stacked=True)

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2022-04-26

我来说两句

0 条评论

登录后参与评论

TOP 榜单

文章

使用熊猫堆叠条形图

使用熊猫堆叠条形图

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Java Eclipse中的错误13，如何解决？

在Windows 7中无法删除文件（2）

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

套接字无法检测到断开连接

带有错误“ where”条件的查询如何返回结果？

有什么解决方案可以将android设备用作Cast Receiver？

Mac OS X更新后的GRUB 2问题

ggplot：对齐多个分面图-所有大小不同的分面

验证REST API参数

如何从视图一次更新多行（ASP.NET - Core）

尝试反复更改屏幕上按钮的位置 - kotlin android studio

计算数据帧中每行的NA

检索角度选择div的当前值

离子动态工具栏背景色

UITableView的项目向下滚动后更改颜色，然后快速备份

VB.net将2条特定行导出到DataGridView

蓝屏死机没有修复解决方案

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException