Reemplazar valores en la columna de marco de datos si la segunda columna coincide con una lista dada de pandas

dward4

Tengo el siguiente marco de datos

      col1          col2
0     str9          val1
1     str8          val2
2     str4          val3
3     str2          val4
4  unknown1    asdvstr1df
5  random1  teststr2test

y la siguiente lista

strings = ['str1', 'str2', 'str3', 'str4']

Quiero reemplazar el valor en la columna 1 si hay una coincidencia en cualquier punto de la cadena en la columna dos con la lista dada, cadenas.

Nota: col2 puede tener los valores de la lista 'cadena' dentro de la cadena, o también en cualquier extremo.

Actualmente estoy haciendo esto con un bucle anidado lento y feo:

import pandas as pd

data_file = pd.DataFrame(data = ([['str9', 'val1'], ['str8',  'val2'], ['str4','val3'] , ['str2', 'val4'] , ['unknown', 'asdvstr1df'] , ['unknown', 'teststr2test']] ), columns = (['col1', 'col2']), dtype = str)
strings = ['str1', 'str2', 'str3', 'str4']

for value in range(data_file.shape[0]):
    for text in strings:
        if (str(data_file.col2[value]).find(text) != -1):
            data_file.loc[value, 'col1'] = text

No estoy seguro de cómo mejorar este lento proceso. ¿Cómo puedo hacer que esto se ejecute más rápido que el tiempo actual de O (nm) (n es el tamaño del archivo de datos, m es el tamaño de la lista llamada cadenas)?

La salida debe ser:

   col1          col2
0  str9          val1
1  str8          val2
2  str4          val3
3  str2          val4
4  str1    asdvstr1df
5  str2  teststr2test

Scott Boston

Damon;

x = '(' + '|'.join(strings)+ ')'
df.assign(col1 = df.col2.str.extract(x, expand=False).combine_first(df.col1))

Salida:

   col1          col2
0  str9          val1
1  str8          val2
2  str4          val3
3  str2          val4
4  str1    asdvstr1df
5  str2  teststr2test

Este artículo se recopila de Internet, indique la fuente cuando se vuelva a imprimir.

En caso de infracción, por favor [email protected] Eliminar

Editado en2020-11-23

Déjame decir algunas palabras

0Comentarios

Iniciar sesiónRevisión de participación posterior

Anterior:Выполнение тестов Selenium в безголовом хроме

TOP Lista

Artículos

Reemplazar valores en la columna de marco de datos si la segunda columna coincide con una lista dada de pandas

Reemplazar valores en la columna de marco de datos si la segunda columna coincide con una lista dada de pandas

¿Cómo ocultar la aplicación web de los robots de búsqueda? (ASP.NET)

Redis 세션 저장소와 함께 SpringSessionBackedSessionRegistry 사용

Ver todos los comentarios en un video de YouTube

Kibana 4 , making pie chart , error message

OAuth 2.0 utilizando Spring Security + WSO2 Identity Server

使用FailureFolicy将`gcloud beta functions deploy`命令转换为Deployment Manager模板

uitableview delete button image in iOS

WPF pleine largeur DataGridColumn sur la largeur de DataGrid

Obtenga todos los comentarios y responda a los comentarios en un solo SQL

Visual Studio 2012 Unit Test Report

Pregunta de fórmula de desplazamiento y transposición de Excel / Google Sheets

Manera correcta de agregar referencias al proyecto C # de modo que sean compatibles con el control de versiones

¿Cómo formatear el valor mínimo y máximo de android-range-seek-bar?

Typescript compiling and changing filenames to lowercase all the time (VS2015)

desbordamiento: oculto no funciona al hacer zoom en un iframe de YouTube usando transformar

선언되지 않은 유형 'MessagingDelegate'사용

Cómo extraer una palabra clave (cadena) de una columna en pandas dataframe en python

¿Cómo puedo hacer accesible la información de color en tablas HTML?

Vscode sin intellisense / autocompletado con múltiples proyectos

ViewPager2 parpadea / recarga al deslizar

Chartkick histogrammes plusieurs couleurs