Tengo un marco de fecha que contiene una lista de nombres de archivos, se ve así a continuación
fname
ill_2_uctry.pdf
ell_23_uctry.pdf
fgy_4_uctry.pdf
:
:
:
hilll_234_uctry.pdf
Quiero dividir las cadenas de la columna fname en un nuevo nombre, que debería verse así a continuación
fname name
ill_2_uctry.pdf ill_2
ell_23_uctry.pdf ell_23
fgy_4_uctry.pdf fgy_4
: :
: :
: :
hilll_234_uctry.pdf hilll_234
Intenté usar, split('_')
pero devolverá una salida que solo contiene la primera parte de la cadena, que se ve así en ill
lugar de la salida que quiero arriba. Me pregunto si estoy usando el método correcto o debería considerar usar otros métodos.
¡Gracias a todos!
Utilizando str.extract
:
df["name"] = df["fname"].str.extract(r'^([^_]+_[^_]+)')
Aquí hay una demostración que muestra que la lógica de expresiones regulares funciona correctamente.
Este artículo se recopila de Internet, indique la fuente cuando se vuelva a imprimir.
En caso de infracción, por favor [email protected] Eliminar
Déjame decir algunas palabras