Acabo de comenzar a usar pandas y reduciría la cantidad de datos que obtengo al fusionar mis DataFrames de esa manera:
Regreso
def merge_df(in_df):
alist = []
for col in in_df.columns:
if len(in_df[col].unique()) == 1:
alist.append(col)
return in_df[alist].T.squeeze()[1]
¿Hay alguna forma más elegante de hacerlo? Por ejemplo, ¿sin recorrer todas las columnas?
Sí, puede eliminar datos duplicados mediante la función simple de pandas. df.drop_duplicates()
Puede consultar la documentación aquí.
Para eliminar datos redundantes de una columna particular, puede pasar el nombre de la columna como un parámetro " subconjunto ". Eliminará toda la fila de datos duplicados.
Este artículo se recopila de Internet, indique la fuente cuando se vuelva a imprimir.
En caso de infracción, por favor [email protected] Eliminar
Déjame decir algunas palabras