在某些日期替换熊猫DataFrame中的NaN（向上采样）

施密德

我是python的新手，但我在下面的示例中苦苦挣扎：我有一个带dateTime-Index的pandas DataFrame和一个带有节日的列。这是日常解决方案。

import pandas as pd
import holidays

hd = holidays.Switzerland(years=[2018])
f = pd.DataFrame(hd.items())
f.columns = ['date', 'feastday']
f['date'] = pd.to_datetime(f['date'])
f = f.set_index('date')

看起来像这样：

date                feastday        
2018-01-01      Neujahrestag
2018-04-01            Ostern
2018-03-30        Karfreitag
2018-04-02       Ostermontag
2018-05-10          Auffahrt
2018-05-20         Pfingsten
2018-05-21     Pfingstmontag
2018-08-01  Nationalfeiertag
2018-12-25       Weihnachten

现在，我希望数据不是每日分辨率，而是6H分辨率：

f1 = f.resample('6H').asfreq()

这可以按我的意愿工作，并导致：

date                     feastday        
2018-01-01 00:00:00  Neujahrestag
2018-01-01 06:00:00           NaN
2018-01-01 12:00:00           NaN
2018-01-01 18:00:00           NaN
2018-01-02 00:00:00           NaN
2018-01-02 06:00:00           NaN
2018-01-02 12:00:00           NaN

但是现在我想为所有2018-01-01而不是仅为第一项填充'Neujahrstag'。结果应如下所示（不仅适用于“ Neujahrstag”，而且适用于mit DataFrame f中的所有项目）。具有相同日期的所有项目在节日中应具有相同的值。该日期的时间无关紧要：

 date                     feastday        
2018-01-01 00:00:00  Neujahrestag
2018-01-01 06:00:00  Neujahrestag
2018-01-01 12:00:00  Neujahrestag
2018-01-01 18:00:00  Neujahrestag
2018-01-02 00:00:00           NaN
2018-01-02 06:00:00           NaN
2018-01-02 12:00:00           NaN

我可以通过以下方式手动替换一项：

f1['2018-01-01'] = f1['2018-01-01']['feastday'][0]

那没有问题，但是我并没有自动为所有数据运行这些东西。我尝试了for循环，但没有成功。有谁能够帮助我。也许还有另一种（更简单的）方法可以达到我的目标？在此先感谢您的帮助。

马可

洛兹

在这种情况下，请.ffill与limit参数一起使用，因为您的频率是6个小时，一天中有24个小时。

df.resample('6H').ffill(limit=3)

#                         feastday
#date                             
#2018-01-01 00:00:00  Neujahrestag
#2018-01-01 06:00:00  Neujahrestag
#2018-01-01 12:00:00  Neujahrestag
#2018-01-01 18:00:00  Neujahrestag
#2018-01-02 00:00:00           NaN
#2018-01-02 06:00:00           NaN
#2018-01-02 12:00:00           NaN
#...

通常，如果事情没有平均分摊，就进行分组分组变换。

df = df.resample('6H').asfreq()
df.groupby(df.index.date).transform('first')

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-12-31

我来说两句

0 条评论

登录后参与评论

上一篇：如何从XMonad中的所有浮动窗口中删除边框

如何用熊猫DataFrame中的先前值替换NaN？

在熊猫DataFrame中用NaN替换字符串（从列表中）

在熊猫DataFrame中将某些值替换为NaN时，如何避免数据类型转换？

熊猫日期时间替换-分配nan值

DataFrame重采样（熊猫）中无结果

根据熊猫中的日期条件，将一列的值替换为NaN

在熊猫中用NaN替换某些字符串

替换DataFrame中的NaN值

重新采样后的熊猫 NaN

如何使用丢失的日期重新采样重新采样的熊猫DataFrame保持当前值

如何用Pandas DataFrame中先前值的某些更改替换NaN？

在熊猫数据框中替换nan

如何用NaN替换熊猫中的值？

在熊猫中，用NaN替换连续的0

如何用熊猫DataFrame中的先前值和后继值的平均值替换NaN？

熊猫-用空的python dict对象替换DataFrame中的所有NaN值

在某些日期之间重复熊猫中的值

如何在特定日期范围内对熊猫列DataFrame中的某些值求和

熊猫在日期列上重新采样

熊猫以开始日期重新采样

在python熊猫中，如何重新采样和插值DataFrame？

从熊猫重新采样对象中删除空的DataFrame

熊猫：用另一个DataFrame替换NaN

熊猫DataFrame中某些动作之间的时差

重新采样 Python 熊猫排除某些字段

在熊猫中，如何替换列中的某些项目？

考虑NaN值+熊猫的采样数据帧

熊猫重新采样并填充末尾的NaN

熊猫重新采样插值产生NaN

TOP 榜单

文章

在某些日期替换熊猫DataFrame中的NaN（向上采样）

在某些日期替换熊猫DataFrame中的NaN（向上采样）

Android Studio Kotlin：提取为常量

计算数据帧R中的字符串频率

如何使用Redux-Toolkit重置Redux Store

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

如何使用tweepy流式传输来自指定用户的推文（仅在该用户发布推文时流式传输）

TreeMap中的自定义排序

TYPO3：将 Formhandler 添加到新闻扩展

遍历元素数组以每X秒在浏览器上显示

在Ubuntu和Windows中，触摸板有时会滞后。硬件问题？

警告消息：在matrix（unlist（drop.item），ncol = 10，byrow = TRUE）中：数据长度[16]不是列数的倍数[10]>？

无法连接网络并在Ubuntu 14.04中找到eth0

将辅助轴原点与主要轴对齐

我可以ping IPv6但不能ping IPv4

在Jenkins服务器中使用Selenium和Ruby进行的黄瓜测试失败，但在本地计算机中通过

提交html表单时为空

使用C ++ 11将数组设置为零

如果从DB接收到的值为空，则JMeter JDBC调用将返回该值作为参数名称

尝试在Dell XPS13 9360上安装Windows 7时出错

如何在R中转置数据

无法使用 envoy 访问 .ssh/config

未捕获的SyntaxError：带有Ajax帖子的意外令牌u