熊猫:在CSV中查找每隔10个数据点的平均值

牙线

我有一个大数据集:

Time,   Value
01.01.2018 00:00:00.000,  5.1398
01.01.2018 00:01:00.000,  5.1298
01.01.2018 00:02:00.000,  5.1438
01.01.2018 00:03:00.000,  5.1228
01.01.2018 00:04:00.000,  5.1168
.... , ,,,,
31.12.2018 23:59:59.000,  6.3498

数据是minutefirst一年中的last某天到一年中的某天的数据

我想用来Pandas查找每5天的平均值。例如:

从平均01.01.2018 00:00:00.00005.01.2018 23:59:59.00005.01.2018

接下来的平均值将来自02.01.2018 00:00:00.0006.01.2018 23:59:59.00006.01.2018

接下来的平均值将来自03.01.2018 00:00:00.0007.01.2018 23:59:59.00007.01.2018

等等...

对于给定的一天,有24小时* 60分钟= 1440个数据点。因此,我需要获取1440个数据点的平均值* 5天= 7200个数据点。

最终的DataFrame将如下所示:

Time,   Value
05.01.2018,  5.1398
06.01.2018,  5.1298
07.01.2018,  5.1438
.... , ,,,,
31.12.2018,  6.3498

底线是计算从今天到过去5天的平均值,平均值如上所示。

我试图通过Python循环进行迭代,但是我想要比Pandas更好的东西。

斯蒂夫

正如您所说的,您分钟都有数据,即每天总是有相同数量的值(1440),那么您可以简单地采用日均值,然后在这些日均值上采用5天滚动窗口的均值。

示例(值是一年中的运行分钟数,从0开始):

s = pd.Series(pd.date_range('2018-01-01', '2018-12-31 23:59', freq='1T'))
df = pd.DataFrame(s.index.values, index=s, columns=['Value'])
df.groupby(df.index.floor('d'))['Value'].mean().rolling(5).mean().dropna() 

结果:

2018-01-05      3599.5
2018-01-06      5039.5
2018-01-07      6479.5
2018-01-08      7919.5
                ...   
2018-12-28    517679.5
2018-12-29    519119.5
2018-12-30    520559.5
2018-12-31    521999.5

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

在熊猫中每隔一列取行平均值(python)

从Python中的数据点查找移动平均值

数据框中任何两个连续行之间的差异的熊猫平均值

合并列表中的每15个数据帧并求平均值

从熊猫数据框计算平均值

查找最高的三个数字的平均值

熊猫数据框平均值

通过获取列之间的平均值合并熊猫中的两个数据框

熊猫数据框平均值与相同CSV的Excel平均值不同吗?

SNS Catplot(箱形图)根据其平均值仅选择要显示的5个数据点

查找数组中每个数组的平均值

2D bin(x,y)并计算10个最深数据点(z)的平均值(c)

熊猫数据框中的几行平均值

根据来自另一个数据框的值查找数据框值的平均值

熊猫:在一个数据框中交换特定的列值,并计算其加权平均值

使用熊猫数据框,如何计算csv日志文件中数据序列的平均值?

从sqlite数据库中查找最后3个非空值的平均值

SAS查找多个数据集的平均值

另一列的每个唯一值的30个最新数据点的平均值

从python中的csv中按键查找平均值

查找列中最后 10 个数值的平均值

Laravel - 多个数据库连接从 3 个表中获得平均值

查找 5000 个不同 csv 的平均值以汇总在一个 Python 列表中

10 个数字的平均值 - C 中的数组

使用python在一个数据框中按类别滚动平均值

熊猫与第二个数据帧的平均值合并

如何获取熊猫数据框中列表的平均值

计算列中两个不同数据点之间的平均值

r中多个数据帧的行平均值