DATAFRAME: eliminar duplicados donde los valores de la columna son iguales para una clave única

luibrain

Quiero eliminar duplicados de DF donde los valores de la columna son iguales para una clave única. Ejemplo:

En:

KEY         SYSTEM
TD-438426   AAA
TD-438426   BBB
TD-438426   AAA
TD-438709   BBB
TD-438709   BBB
TD-438750   CCC
TD-438750   CCC
TD-438750   CCC
TD-438874   AAA
TD-438874   BBB

Afuera:

KEY         SYSTEM
TD-438426   AAA
TD-438426   BBB
TD-438709   BBB
TD-438750   CCC
TD-438874   AAA
TD-438874   BBB

PD Por supuesto, hay algunas excepciones que quiero captar.

En:

KEY         TEST    SYSTEM
TD-438426   ABC     AAA
TD-438426   ABC     BBB

Afuera:

KEY         TEST    SYSTEM
TD-438426   ABC     AAA
TD-438426   ABC     BBB

Y

En:

KEY         TEST    SYSTEM
TD-438426   ABC     AAA
TD-438426   CBA     AAA

Afuera:

KEY         TEST    SYSTEM
TD-438426   ABC     AAA
rcshon

Como @mcsioni mencionó en los comentarios, lo que estás buscando esdf.drop_duplicates()

Además, es útil comprender dos argumentos de este método, a saber, subsety keep.

Por ejemplo, desea conservar solo valores únicos en la KEYcolumna y mantener el primer SYSTEMvalor para cada único KEY, haría lo siguiente:

df.drop_duplicates(subset=['KEY'], keep='first')

Si acaba de usar df.drop_duplicates()sin ningún argumento, el subconjunto serán todas las columnas, que es lo que solicita el resultado deseado.

EDITAR

Para mantenerse al día con su nuevo requisito, haga lo siguiente:

df.drop_duplicates(subset=['KEY', 'SYSTEM'], keep='first')

Nota: el comportamiento predeterminado para el keepargumento es 'first', pero no está de más, ser explícito cuando se trabaja con bibliotecas de alto nivel como pandas.

Este artículo se recopila de Internet, indique la fuente cuando se vuelva a imprimir.

En caso de infracción, por favor [email protected] Eliminar

Editado en
0

Déjame decir algunas palabras

0Comentarios
Iniciar sesiónRevisión de participación posterior

Artículos relacionados

DATAFRAME: eliminar duplicados donde los valores de la columna son iguales para una clave única

Seleccione las identificaciones donde los valores de la columna son iguales y no iguales

¿Cómo fusionar la lista de dictados con la misma clave donde los valores son iguales?

Eliminar duplicados de la matriz cuando dos valores son iguales

Eliminar la columna si todos los valores son iguales a un valor de cadena

Combinar filas de SQL donde los valores de la columna X son iguales pero los valores de la columna Y son diferentes (deben anularse)

Compruebe si todos los valores de una columna son iguales en PySpark Dataframe

Cómo obtener esas filas donde todos los valores son iguales frente a una identificación única

T-SQL Cómo seleccionar el recuento de los valores de una columna donde los valores de otra columna son iguales

Hive seleccione una columna basada en una segunda columna donde los valores de la segunda columna son diferentes

Elija entre dos valores de una columna donde los valores en otras columnas de la tabla son los mismos

Elija entre dos valores de una columna donde los valores en otras columnas de la tabla son los mismos

¿Cómo enumerar los valores de un objeto json que son iguales a la clave en una matriz?

Pandas: crea un dictado donde una columna es clave y la lista de columnas restantes son valores

Cree Python DataFrame desde el diccionario donde las claves son los nombres de columna y los valores de la fila

Encuentre la fila donde los valores de la columna son máximos en un DataFrame de pandas

Seleccione TODAS las filas donde los valores de la columna Pandas DataFrame en una lista

Reducir matrices donde los valores son iguales

Pandas: fusiona DataFrame con Series cuando todos los valores de columna son iguales.

SUMA de una columna cuando los valores son iguales al valor establecido

Para eliminar los duplicados de contactos de vcard, comparar si dos vcards son iguales en el archivo .vcf no funciona con la comparación simple == vobject

Cómo contraer los valores de una serie donde los valores son una lista en una lista única

R: eliminar filas donde los valores de una columna no coinciden con otra columna

¿Cómo creo una nueva columna en pyspark donde los valores de fila son los mismos?

¿Cómo encontrar y eliminar duplicados en una columna según los valores de otra columna?

Matriz de objetos separan valores que son iguales en una clave para otra matriz

Usar "aplicar" para aplicar una función a una matriz donde los parámetros son específicos de la columna

Excel, si los valores que se ingresan en una columna específica son iguales a cualquier valor de la columna x en la hoja 2, arroja un error

Descartar columna si más de la mitad de los valores son iguales - Python

TOP Lista

CalienteEtiquetas

Archivo