熊猫，groupby和特定月份的求和

斯塔夫罗斯·阿纳斯塔西亚迪斯（Stavros Anastasiadis）

我有一个DataFrame：

<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 982 entries, 2009-10-30 00:00:00 to 2012-12-16 00:00:00
Data columns (total 4 columns):
rain        981  non-null values
temp_max    982  non-null values
temp_min    982  non-null values
temp        982  non-null values
dtypes: float64(4)

对于每年/每月的总计，我使用：

mdata = data.groupby([lambda x: x.year, lambda x: x.month]).agg([sum])

但是我需要进行季节性分析（夏季，冬季等），因此如何创建特定年份的总和，例如每年的[1、2、3]？

泰

伍迪的骄傲

是的，对我来说似乎很整洁的一种解决方案是使用Seasons字典，然后使用函数对数据进行分组。每个索引值都会调用一次作为组键传递的任何函数，并将返回值用作组名。

import pandas as pd
import numpy as np
from pandas import DataFrame
import datetime
# Create a year's worth of data
base = datetime.date.today() - datetime.timedelta(365)
Datelist = [base + datetime.timedelta(days = x) for x in range(365)]
DF = DataFrame(np.random.rand(365), index = Datelist)

# Create a Seasonal Dictionary that will map months to seasons
SeasonDict = {11: 'Winter', 12: 'Winter', 1: 'Winter', 2: 'Spring', 3: 'Spring', 4: 'Spring', 5: 'Summer', 6: 'Summer', 7: 'Summer', \
8: 'Autumn', 9: 'Autumn', 10: 'Autumn'}

# Write a function that will be used to group the data
def GroupFunc(x):
    return SeasonDict[x.month]

# Call the function with the groupby operation. 
Grouped = DF.groupby(GroupFunc)
Grouped.sum()

该函数获取每个索引值，并在“季节字典”中查找月份，然后返回与月份键对应的值。然后，该值成为组名。

另外，您也可以像示例中那样使用lambda（效率更高，但我认为上面的内容更容易理解）：

DF.groupby(lambda x: SeasonDict[x.month]).sum()

每个注释的附加代码在我看来，切片数据会更好。因此，您可以执行以下操作

DF['Season'] = ""
for row in DF.index:
    DF.Season[row] = SeasonDict[row.month]
DFWinter = DF[DF.Season == 'Winter']

现在，您有了一个包含冬季数据的新数据框，可以根据需要进行操作。区别在于，groupby操作允许您对所有数据执行相同的操作，而听起来您想以不同的方式调查数据集不同部分的属性。为此，最好使用布尔切片来切片。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-03-11

我来说两句

0 条评论

登录后参与评论

上一篇：Xubuntu 17.10-没有声音，Alsa说没有这样的文件或目录

熊猫groupby获取月份和年份的值

熊猫每年对特定月份范围内的每个值求和

按特定月份和日期在熊猫中切片

如何从熊猫的历年中提取特定的月份和日期？

熊猫计数和求和特定条件仅返回 nan

熊猫仅对特定列进行分组和求和

熊猫分组的月份和年份

熊猫，groupby / Grouper在忽略年份的月份

熊猫groupby并加上当前月份

pandas groupby id 和月份

在熊猫中使用groupby时如何分别对负值和正值求和？

使用groupby按条件求和熊猫列

熊猫数据框与多个groupby求和

Python熊猫-装箱和求和

根据熊猫中的特定年份和月份从多个日期列中过滤行

熊猫，groupby和count

熊猫Multiindex和Groupby

熊猫groupby和filter

熊猫groupby和qcut

熊猫groupby，包含和

Groupby和熊猫样本

groupby 和 for 循环与熊猫

Groupby和循环熊猫

了解groupby和熊猫

在熊猫中特定月份的平均值

LINQ GroupBy 月份和颜色计数

如何对熊猫中特定行的值求和？

如何使用熊猫分组和求和

熊猫：如何对MultiIndex进行分组和求和

TOP 榜单

文章

熊猫，groupby和特定月份的求和

熊猫，groupby和特定月份的求和

构建类似于Jarvis的本地语言应用程序

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

SQL Server中的非确定性数据类型

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

Swift 2.1-对单个单元格使用UITableView

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

HttpClient中的角度变化检测

如何了解DFT结果

错误：找不到存根。请确保已调用spring-cloud-contract：convert

Embers js中的更改侦听器上的组合框

在Wagtail管理员中，如何禁用图像和文档的摘要项？

如何避免每次重新编译所有文件？

Java中的循环开关案例

ng升级性能注意事项

Swift中的指针替代品？

如何使用geoChoroplethChart和dc.js在Mapchart的路径上添加标签或自定义值？

使用分隔符将成对相邻的数组元素相互连接

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

ggplot：对齐多个分面图-所有大小不同的分面

完全禁用暂停（在内核级别？-必须与使用的DE和登录状态无关！）