为什么在使用cumsum时重新采样不同的熊猫?

用户名

例如,如果我想使用1天的总和在下面进行重新采样,则会得到预期的结果(5个数据点)

idx = pd.date_range('2018-01-01', periods=100, freq='H')
ts = pd.Series(range(len(idx)), index=idx)

data_sum= ts.resample('1d').agg(['sum'])

但是,尽管我使用相同的方法进行了1天的重采样,但仍获得了100个数据点的累积值。

data_cumsum= ts.resample('1d').agg(['cumsum'])

是不是应该只返回5个数据点?为什么cumsum的行为与其他aggs不同?

耶斯列尔

答案很简单-大部分功能聚合数据一样summean但有些不一样cumsumdiffffillbfill

所以这是原因在差异resample和也groupby

这是可能的用法Resampler.transform-它重复了重新采样的数据,因此得到了100行,因为没有实现累加器的累加总和,因此使用Grouper和的替代方法GroupBy.cumsum

data_sum= ts.resample('1d').transform('sum')
data_cumsum= ts.groupby(pd.Grouper(freq='1d')).cumsum()

print (data_sum)
2018-01-01 00:00:00     276
2018-01-01 01:00:00     276
2018-01-01 02:00:00     276
2018-01-01 03:00:00     276
2018-01-01 04:00:00     276

2018-01-04 23:00:00    2004
2018-01-05 00:00:00     390
2018-01-05 01:00:00     390
2018-01-05 02:00:00     390
2018-01-05 03:00:00     390
Freq: H, Length: 100, dtype: int64

print (data_cumsum)
2018-01-01 00:00:00       0
2018-01-01 01:00:00       1
2018-01-01 02:00:00       3
2018-01-01 03:00:00       6
2018-01-01 04:00:00      10

2018-01-04 23:00:00    2004
2018-01-05 00:00:00      96
2018-01-05 01:00:00     193
2018-01-05 02:00:00     291
2018-01-05 03:00:00     390
Freq: H, Length: 100, dtype: int64

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

在重新采样数据时,为什么在csv文件中没有重新采样连续

熊猫:使用groupby重新采样时间序列

使用重新采样为熊猫数据框中的不同列使用不同规则聚合数据

熊猫重新采样文档

累积函数返回数据帧时熊猫重新采样

熊猫在24小时内重新采样时间序列

重新采样熊猫datetimeindex时可能保留ID字段吗?

为什么熊猫'=='与'.eq()'不同

如何使用丢失的日期重新采样重新采样的熊猫DataFrame保持当前值

使用熊猫,如何重新采样并应用函数以添加列?

如何使用离散数据对熊猫中的数据进行重新采样?

在以W-MON频率进行重采样时,为什么熊猫会向前滚动一周?

熊猫重新采样未来警告

熊猫分组和重新采样

熊猫在日期列上重新采样

熊猫以开始日期重新采样

重新采样后的熊猫 NaN

大熊猫> = 0.18-更改为重新采样,如何使用groupby进行升采样

为什么在重新使用位图时总是出现异常?

为什么在使用组件时重新定义端口?

为什么在使用ajax上传文件时重新加载页面?

重新采样不同的时间序列

为什么使用列表与使用元组时得到不同的结果?

为什么在使用多重继承时使用不同的`this`地址

使用python重新采样数据框时出错

为什么每次收到不同的密钥时都会重新安装组件?

为什么在使用 predict() 时拟合结果如此不同?

为什么使用引号时“ wsl”会产生不同的结果?

为什么使用 tf.print 时张量形状不同?