J'ai une colonne dans un dataframe avec du texte libre. Je veux remplacer les mots commençant par AA et se terminant par AA dans le texte. Quelqu'un peut-il suggérer comment faire cela?
Voici une solution simple utilisant la méthode replace str et le modèle regex
>>> df=pandas.DataFrame({'example':['AAhelloAA','Arreviour','Dunno this is a example of it','a knee','an arrow','AAnother example ofAA']})
>>> print(df)
example
0 AAhelloAA
1 Arreviour
2 Dunno this is a example of it
3 a knee
4 an arrow
5 AAnother example ofAA
>>> df['example'].str.replace(r'(AA).*?(AA)','NEW CHANGE!')
0 NEW CHANGE!
1 Arreviour
2 Dunno this is a example of it
3 a knee
4 an arrow
5 NEW CHANGE!
Name: example, dtype: object
Je dois préciser que le modèle de regex fonctionne dans tout texte qui commence et se termine par AA.
Cet article est collecté sur Internet, veuillez indiquer la source lors de la réimpression.
En cas d'infraction, veuillez [email protected] Supprimer.
laisse moi dire quelques mots