Llene los valores nulos en una columna usando el cambio porcentual de una segunda columna mientras agrupa por una tercera columna

ahh_real_numbers

Tengo un marco de datos que se parece a esto:

grp    val    run
a      5      10
b      10     1
a      NaN    8
a      NaN    4
b      NaN    5
b      NaN    4
a      10     6
a      NaN    6

Quiero llenar los espacios en la valcolumna aplicando el mismo cambio porcentual que se calculó. Sin embargo, también necesito agrupar usando la grpcolumna. Debería terminar con algo como esto:

grp    val    run
a      5      10
b      10     1
a      4      8
a      2      4
b      50     5
b      40     4
a      10     6
a      10     6

Solo quiero reemplazar valores que son nulos. Observe que el 10 en la fila siete "restablece" el relleno hacia adelante.

Sin tener que agrupar, podría simplemente obtener el cambio porcentual runy multiplicar la valcelda de la fila anterior por la celda de cambio porcentual de la fila actual donde valno sea nulo.

Estaba pensando que podría ordenar el marco de datos usando grp, pero luego todavía tendría que preocuparme por el caso límite de cuando los grpvalores cambian.

Quang Hoang

Intentemos:

# identify the na blocks and group by `grp` and these blocks
na_blocks = df['val'].notna().groupby(df['grp']).cumsum()    
g = df.groupby(['grp', na_blocks])

# "pct change" on run
df['x'] = df['run'] / g['run'].shift(fill_value=1)

# cumprod() for cumulative change
# `ffill` and `transform('first')` behave the same 
# since we are grouping on non-nan following by consecutive nan's
df['val'] = g['val'].ffill() * g['x'].cumprod() / g['run'].transform('first')

Salida ( xla columna adicional que se puede quitar):

  grp   val  run     x
0   a   5.0   10  10.0
1   b  10.0    1   1.0
2   a   4.0    8   0.8
3   a   2.0    4   0.5
4   b  50.0    5   5.0
5   b  40.0    4   0.8
6   a  10.0    6   6.0
7   a  10.0    6   1.0

Este artículo se recopila de Internet, indique la fuente cuando se vuelva a imprimir.

En caso de infracción, por favor [email protected] Eliminar

Editado en2021-01-28

Déjame decir algunas palabras

0Comentarios

Iniciar sesiónRevisión de participación posterior

Anterior:R: Cómo recodificar niveles de factor binario (0 = 0, 1 = 1) en BASE R

TOP Lista

Artículos

Llene los valores nulos en una columna usando el cambio porcentual de una segunda columna mientras agrupa por una tercera columna

Llene los valores nulos en una columna usando el cambio porcentual de una segunda columna mientras agrupa por una tercera columna

¿Cómo ocultar la aplicación web de los robots de búsqueda? (ASP.NET)

Redis 세션 저장소와 함께 SpringSessionBackedSessionRegistry 사용

Ver todos los comentarios en un video de YouTube

Kibana 4 , making pie chart , error message

OAuth 2.0 utilizando Spring Security + WSO2 Identity Server

使用FailureFolicy将`gcloud beta functions deploy`命令转换为Deployment Manager模板

uitableview delete button image in iOS

WPF pleine largeur DataGridColumn sur la largeur de DataGrid

Obtenga todos los comentarios y responda a los comentarios en un solo SQL

Visual Studio 2012 Unit Test Report

Pregunta de fórmula de desplazamiento y transposición de Excel / Google Sheets

Manera correcta de agregar referencias al proyecto C # de modo que sean compatibles con el control de versiones

¿Cómo formatear el valor mínimo y máximo de android-range-seek-bar?

Typescript compiling and changing filenames to lowercase all the time (VS2015)

desbordamiento: oculto no funciona al hacer zoom en un iframe de YouTube usando transformar

선언되지 않은 유형 'MessagingDelegate'사용

Cómo extraer una palabra clave (cadena) de una columna en pandas dataframe en python

¿Cómo puedo hacer accesible la información de color en tablas HTML?

Vscode sin intellisense / autocompletado con múltiples proyectos

ViewPager2 parpadea / recarga al deslizar

Chartkick histogrammes plusieurs couleurs