r enumerar los valores principales basados en el promedio de otra columna

jumpman8947

Tengo datos cargados desde un archivo csv (mydata.csv).

mydata = read.csv('somefile')

Las dos columnas con las que quiero trabajar (mydata ['nombre'] y mydata ['puntuación']) tienen datos como este

name     score
sally     5
peter     10
sally     50
peter     25
mandy     100
mandy     0

El conjunto de datos tiene más de 3 nombres pero, por ejemplo, solo di tres nombres. Lo que quiero hacer es obtener los 10 nombres principales con la puntuación media más alta y almacenar esa información.

Además, en qué tipo de datos es mejor almacenar los resultados (matriz, lista, etc.) si quiero graficar estos puntos (nombres, puntaje) en un ggplot usando x para nombre ey para puntaje.

Shirin Yavari

Creo el marco de datos y me limitaré a 2 nombres con el puntaje promedio más alto en lugar de los 10 originales debido al límite de datos:

  df<-data.frame(name =c('sally','peter','sally','peter','mandy','mandy'),score=c(5,10,50,25,100,0))

 library("dplyr")
  FinalOutput <- df %>%
  group_by(name) %>% #group by name
  summarise(avg_score=mean(score)) %>% #create variabele "avg_score" which hold the mean of scores for each name
  top_n(2) %>% #select the top 2, you can change it to 10 with your real data 
  arrange(desc(avg_score)) #arrange in a descending fashion to get the names with highest avg_score 

Aquí hay una captura de pantalla de la salida:

 # A tibble: 2 x 2
 #   name  avg_score
 #   <fct>     <dbl>
 #1 mandy      50.0
 #2 sally      27.5

aquí está para salvarlo:

 write.csv(FinalOutput,file="FinalOutput.csv")  

y aquí está para trazarlo:

 print(ggplot(data = FinalOutput, aes(x = name, y = avg_score))+ geom_point())

Este artículo se recopila de Internet, indique la fuente cuando se vuelva a imprimir.

En caso de infracción, por favor [email protected] Eliminar

Editado en
0

Déjame decir algunas palabras

0Comentarios
Iniciar sesiónRevisión de participación posterior

Artículos relacionados

Valores promedio de una columna basados en los valores de otra

Combinó dos marcos de datos basados en el índice, reemplazando los valores coincidentes en otra columna

Obtener valores basados en el máximo de otra columna

Pandas, resta valores basados en el valor de otra columna

Copiar los valores de una columna, basados en los valores de otra columna

Encuentre los valores promedio de una columna en términos del rango de fechas de otra columna en R

los pandas clasifican los valores de una columna por el promedio de la otra columna

¿Puedo enumerar los valores únicos para una columna mientras agrupo por otra columna en R?

extraer los valores principales de una columna en función de otra columna

Obtenga valores distintos de una columna basados en valores distintos en otra columna usando R

Encuentre los valores mínimos de la columna df basados en otra columna

Encuentre los valores mínimos de la columna df basados en otra columna

R: ¿Cómo crear una nueva columna con valores basados en ciertos valores de otra columna?

Oracle SQL: obtenga el recuento de valores de columna distintos basados en otra columna

Obtener valores de columna basados en cambios en otra columna

Obtener valores de columna basados en cambios en otra columna

suma de los n valores principales basados en criterios filtrados

¿Cómo puedo crear números de pedido basados en los valores de otra columna?

Función de Python para completar los valores nan basados en otra columna

Encuentre los 5 valores principales basados en la suma de la última columna y la última fila

Calcular el promedio de una columna en R por otros ID en otra columna

definir los saltos de eje basados en otra columna sin guardar el marco de datos antes

Tengo un marco de datos y quiero llenar todos los valores de columna vacíos basados en filas anteriores con valores idénticos basados en otra columna.

Tengo un marco de datos y quiero llenar todos los valores de columna vacíos basados en filas anteriores con valores idénticos basados en otra columna.

Necesito seleccionar el mismo nombre de columna dos veces con valores diferentes basados en otra tabla

Obtenga el promedio de los 5 valores más altos de cada columna por mes en R

restar valores a en la columna en R en función de los valores en otra columna

Actualice los valores de columna de forma aleatoria según el valor de otra columna en R

¿Cómo obtener el promedio de valores de una columna de un marco de datos basado en otra columna?

TOP Lista

CalienteEtiquetas

Archivo