calcular el valor promedio del marco de datos de pandas

bikuser Publicado en Dev

ciclista

Tengo un marco de datos con fecha y hora como índice. Los datos son solo de diciembre, enero y febrero. Traté de calcular el valor medio de diciembre, enero y febrero. Cuando me gustó:

df.resample('a').mean()

entonces me da el valor medio de ene feb dic.

¿Hay alguna forma de hacer eso en pandas dataframe?

mis datos se ven así:

2000-02-29    0.046871
2000-03-31         NaN
2000-04-30         NaN
2000-05-31         NaN
2000-06-30         NaN
2000-07-31         NaN
2000-08-31         NaN
2000-09-30         NaN
2000-10-31         NaN
2000-11-30         NaN
2000-12-31    0.015948
2001-01-31    0.020552
2001-02-28    0.033409
2001-03-31         NaN
2001-04-30         NaN
2001-05-31         NaN
2001-06-30         NaN
2001-07-31         NaN
2001-08-31         NaN
2001-09-30         NaN
2001-10-31         NaN
2001-11-30         NaN
2001-12-31    0.013204
2002-01-31    0.017093
2002-02-28    0.019723
2002-03-31         NaN
2002-04-30         NaN

Jezreel

Necesitas groupbycon strftime:

df = df.groupby(df.index.strftime('%b')).mean()
print (df)
          col
Dec  0.014576
Feb  0.033334
Jan  0.018822

Si quieres también años:

df = df.groupby(df.index.strftime('%Y-%b')).mean()
print (df)
               col
2000-Dec  0.015948
2000-Feb  0.046871
2001-Dec  0.013204
2001-Feb  0.033409
2001-Jan  0.020552
2002-Feb  0.019723
2002-Jan  0.017093

Otra solución es convertir a to_period:

df = df.groupby(df.index.to_period('m')).mean()
print (df)
              col
2000-02  0.046871
2000-12  0.015948
2001-01  0.020552
2001-02  0.033409
2001-12  0.013204
2002-01  0.017093
2002-02  0.019723

EDITAR:

Necesita un turno de un mes porque Decembery luego agrupar por year:

year = df.shift(freq='m').index.year
print (year)
Int64Index([2000, 2000, 2000, 2000, 2000, 2000, 2000, 2000, 2000, 2000, 2001,
            2001, 2001, 2001, 2001, 2001, 2001, 2001, 2001, 2001, 2001, 2001,
            2002, 2002, 2002, 2002, 2002],
           dtype='int64')


df = df.groupby(year).mean()
print (df)
           col
2000  0.046871
2001  0.023303
2002  0.016673

Este artículo se recopila de Internet, indique la fuente cuando se vuelva a imprimir.

En caso de infracción, por favor [email protected] Eliminar

Editado en2020-11-29

Déjame decir algunas palabras

0Comentarios

Iniciar sesiónRevisión de participación posterior

Anterior:Odoo 10: agregar un registro a un conjunto de registros existente

TOP Lista

Artículos

calcular el valor promedio del marco de datos de pandas

calcular el valor promedio del marco de datos de pandas

¿Cómo ocultar la aplicación web de los robots de búsqueda? (ASP.NET)

La autenticación de cookies de ASP.Net Core no es persistente

Manera correcta de agregar referencias al proyecto C # de modo que sean compatibles con el control de versiones

WPF pleine largeur DataGridColumn sur la largeur de DataGrid

El botón en UITableViewCell personalizado no responde en iOS 7

Encuentre el filtro de muesca adecuado para eliminar el patrón de la imagen

Obtenga React propType name, type y isRequired

Ver todos los comentarios en un video de YouTube

play2 framework my template is not seen. : package views.html does not exist

Enlace débil de iOS Framework: error de símbolos indefinidos

Comment développer plusieurs packages Swift Package Manager dans Xcode?

Method does not presize the allocation of a collection

¿Cómo formatear el valor mínimo y máximo de android-range-seek-bar?

La différence entre la ligne alligned et indent line wrap dans notepad ++?

트루 타입 글꼴을 렌더링하지 않는 SDL

OAuth 2.0 utilizando Spring Security + WSO2 Identity Server

Editor de texto enriquecido (WYSIWYG) en CRM 2013

Link library in Visual Studio, why two different ways?

Search Dropdown Javascript - How to hide list?

caída condicional de filas desde un marco de datos de pandas

Cerrar el menú de material angular desde el controlador