pandas.DataFrame.groupby 省略列

尚卡拉

我有一个包含一些值的 Pandas DataFrame,我想根据date总结这些值

DataFrame 如下所示:

在此处输入图片说明

当我跑步时,pandas.DataFrame.groupby(['date']).sum()我得到

在此处输入图片说明

如您所见,这不是我想要的结果,因为我想要汇总所有列,而不仅仅是polaritysubjectivity

有谁知道为什么它只总结了这两个,我怎么能得到想要的结果?

谢谢你。

二凡

我们需要numeric列能够对它们进行计算,在这种情况下sum

#Example dataframe
df = pd.DataFrame({'date':['2019-01-04', '2019-01-04', '2019-01-03', '2018-12-22', '2018-08-31'],
                   'replies_count':['46', '143', '64', '154', '50'],
                   'polarity':[10, 20, 30, 40, 50]})

print(df)
         date replies_count  polarity
0  2019-01-04            46        10
1  2019-01-04           143        20
2  2019-01-03            64        30
3  2018-12-22           154        40
4  2018-08-31            50        50

检查列的类型

print(df.dtypes)

date             object
replies_count    object
polarity          int64
dtype: object

应用groupbysum

print(df.groupby('date').sum())

            polarity
date                
2018-08-31        50
2018-12-22        40
2019-01-03        30
2019-01-04        30

现在将replies_count列的类型更改int并执行相同groupby的操作sum

df['replies_count'] = df['replies_count'].astype(int)

print(df.groupby('date').sum())
            replies_count  polarity
date                               
2018-08-31             50        50
2018-12-22            154        40
2019-01-03             64        30
2019-01-04            189        30

正如我们所见,该列现在已包含在内。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

Pandas Dataframe Groupby 多列

在Pandas DataFrame中以逗号连接groupby列

pandas dataframe groupby 不会丢失被分组的列

具有多列的 Pandas Dataframe Groupby 并将其求和

单个DataFrame列python / pandas中的groupby逗号分隔值

使用 Pandas 在 groupby DataFrame 中标记更改列

使用groupby条件遍历Pandas DataFrame中的列

pandas dataframe groupby 应用多列并获取计数

pandas dataframe groupby 按多列条件获取计数

pandas add column to groupby dataframe

Pandas DataFrame:重组以下 .groupby()

Pandas DataFrame GroupBy sum/count to new DataFrame

使用 groupby 列从 Min 和 Max 列值计算 Pandas Dataframe 的变化率

python-pandas groupby 到平面 DataFrame

groupby之后如何获取Pandas DataFrame的行号

Python Pandas Dataframe GroupBy基于条件的大小

Pandas Groupby、Sum 和 Flatten Dataframe

重置从groupby或pivot创建的pandas DataFrame的索引?

将Pandas GroupBy转换为DataFrame

python pandas dataframe groupby或pivot_table

对子类DataFrame进行Pandas groupby,resample等

Python pandas - DataFrame groupby and re-construct

Python Pandas Dataframe Groupby Sum 问题

Pandas dataframe groupby 使用独特的组合

如何基于groupby操作产生的组获取pandas DataFrame的组ID值的列

Groupby 列,按时间戳排序并计算 Pandas Dataframe 中时间戳之间的差异?

执行pandas.DataFrame.groupby()。sum()时保留非数字列

如何在groupby中包括Pandas DataFrame中不存在的列

在 groupby - Pandas 之后附加来自原始 DataFrame 的特定列值