Use el diccionario para reemplazar una cadena dentro de una cadena en las columnas de Pandas

SBaker Publicado en Dev

owwoow14

Estoy tratando de usar un dictionary keypara reemplazar stringsen una pandascolumna con su values. Sin embargo, cada columna contiene frases. Por lo tanto, primero debo tokenizar las oraciones y detectar si una palabra en la oración se corresponde con una clave en mi diccionario, luego reemplazar la cadena con el valor correspondiente.

Sin embargo, el resultado que sigo obteniendo es ninguno. ¿Existe una forma pitónica mejor de abordar este problema?

Aquí está mi MVC por el momento. En los comentarios, especifiqué dónde está sucediendo el problema.

import pandas as pd

data = {'Categories': ['animal','plant','object'],
    'Type': ['tree','dog','rock'],
        'Comment': ['The NYC tree is very big','The cat from the UK is small','The rock was found in LA.']
}

ids = {'Id':['NYC','LA','UK'],
      'City':['New York City','Los Angeles','United Kingdom']}


df = pd.DataFrame(data)
ids = pd.DataFrame(ids)

def col2dict(ids):
    data = ids[['Id', 'City']]
    idDict = data.set_index('Id').to_dict()['City']
    return idDict

def replaceIds(data,idDict):
    ids = idDict.keys()
    types = idDict.values()
    data['commentTest'] = data['Comment']
    words = data['commentTest'].apply(lambda x: x.split())
    for (i,word) in enumerate(words):
        #Here we can see that the words appear
        print word
        print ids
        if word in ids:
        #Here we can see that they are not being recognized. What happened?
            print ids
            print word
            words[i] = idDict[word]
            data['commentTest'] = ' '.apply(lambda x: ''.join(x))
    return data

idDict = col2dict(ids)
results = replaceIds(df, idDict)

Resultados:

None

Estoy usando python2.7y cuando estoy imprimiendo dict, hay u'de Unicode.

Mi resultado esperado es:

Categorías

Comentario

Tipo

howTest

  Categories  Comment  Type commentTest
0 animal  The NYC tree is very big tree The New York City tree is very big 
1 plant The cat from the UK is small dog  The cat from the United Kingdom is small 
2 object  The rock was found in LA. rock  The rock was found in Los Angeles.

Jezreel

Puede crear dictionaryy luego replace:

ids = {'Id':['NYC','LA','UK'],
      'City':['New York City','Los Angeles','United Kingdom']}

ids = dict(zip(ids['Id'], ids['City']))
print (ids)
{'UK': 'United Kingdom', 'LA': 'Los Angeles', 'NYC': 'New York City'}

df['commentTest'] = df['Comment'].replace(ids, regex=True)
print (df)
  Categories                       Comment  Type  \
0     animal      The NYC tree is very big  tree   
1      plant  The cat from the UK is small   dog   
2     object     The rock was found in LA.  rock   

                                commentTest  
0        The New York City tree is very big  
1  The cat from the United Kingdom is small  
2        The rock was found in Los Angeles.

Este artículo se recopila de Internet, indique la fuente cuando se vuelva a imprimir.

En caso de infracción, por favor [email protected] Eliminar

Editado en2020-11-10

Déjame decir algunas palabras

0Comentarios

Iniciar sesiónRevisión de participación posterior

Anterior:MongoDB aggregation lookup

TOP Lista

Artículos

Use el diccionario para reemplazar una cadena dentro de una cadena en las columnas de Pandas

Use el diccionario para reemplazar una cadena dentro de una cadena en las columnas de Pandas

¿Cómo ocultar la aplicación web de los robots de búsqueda? (ASP.NET)

OAuth 2.0 utilizando Spring Security + WSO2 Identity Server

Manera correcta de agregar referencias al proyecto C # de modo que sean compatibles con el control de versiones

Ver todos los comentarios en un video de YouTube

uitableview delete button image in iOS

¿Título del selector de SwiftUI?

Swift / Firebase : Facebook 사용자가 계정을 만들 때 Firebase 데이터베이스에 제대로 저장하려면 어떻게해야합니까?

¿Es posible reemplazar los valores de un archivo config.properties a través de TFS?

Representación de mapas 3D en juegos

Golang ListenAndServeTLS devuelve datos cuando no se usa https en el navegador

Declarar propiedades reactivas (agregar bloques de componentes dinámicamente desde la inserción de matriz)

Cómo hacer que SwiftUI Text multilineTextAlignment comience desde arriba y centro

Cómo depurar una aplicación React en Visual Studio 2019 usando la plantilla "Blank Node.js"

Múltiples relaciones en la misma tabla con dos columnas Laravel

No existe tal archivo o directorio cuando se inicia el nombre del directorio con /

Verilog : 입력 신호를 한 클럭 주기로 지연시키는 방법은 무엇입니까?

¿Cómo hacer un generador de ruido Perlin más suave?

Problème avec le dessin d'un élément Qml avec des appels OpenGL bruts

El nombre 'HttpContext' no existe en el contexto actual en Razor

WPF pleine largeur DataGridColumn sur la largeur de DataGrid

Tengo algunos problemas con el syscall de golang cuando llamo a dll en win7-64