Python: diviser la chaîne en deux colonnes par plus d'un séparateur

user13672551

J'importe des données à partir d'un fichier csv, je veux diviser la colonne 'topThemes' en un tableau / dataframe avec deux colonnes.
Dans la première colonne, je veux avoir le nom du thème (par exemple Biologie), dans la deuxième colonne je veux sa partition associée (par exemple 62).
Lorsque j'importe la colonne, elle est stockée dans ce format:

Biology: 62\n
Economics: 12\n
Physics: 4\n
Chemistry: 8\n
and so on.

Mon code actuel et l'erreur sont indiqués ci-dessous.

Code:

df = pd.read_csv(r'myfilelocation')

split = [line.split(': ') for line in df['topThemes'].split('\n')]

Erreur:

AttributeError("'Series' object has no attribute 'split'")

Fichier CSV en cours d'importation:

Mon fichier csv

Comment je veux que ça ressemble:

Format idéal

Merci pour toute aide / réponse.

Terry Spotts

Spécifiez le délimiteur à utiliser avec sepet les noms de colonnes avec namesde la read_csv()fonction:

df = pd.read_csv(r'myfilelocation', sep=':', names=['topThemes', 'score'])

Documentation ici: https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

Oh, je vois votre fichier CSV source maintenant ...
Il existe probablement un moyen plus propre de le faire en moins d'étapes, mais je pense que cela produit la sortie demandée:

data = pd.read_csv(r'myfilelocation', usecols=['topThemes'])
data = pd.DataFrame(data['topThemes'].str.split('\n').values.tolist()).stack().to_frame(name='raw')

df = pd.DataFrame()
df[['topTheme', 'score']] = data['raw'].apply(lambda x: pd.Series(str(x).split(":")))
df.dropna(inplace=True)

Cet article est collecté sur Internet, veuillez indiquer la source lors de la réimpression.

En cas d'infraction, veuillez [email protected] Supprimer.

modifier le2021-01-24

laisse moi dire quelques mots

0commentaires

connexionAprès avoir participé à la revue

Article précédent:Thread de travail IIS vs thread d'application Web

TOP liste

article

Python: diviser la chaîne en deux colonnes par plus d'un séparateur

Python: diviser la chaîne en deux colonnes par plus d'un séparateur

comment afficher un bouton au-dessus d'un autre élément ?

impossible d'obtenir l'image d'arrière-plan en plein écran dans reactjs

Je continue à obtenir l'objet 'WSGIRequest' n'a pas d'attribut 'Get' sur django

comment supprimer "compte de connexion google" à des fins de développement - actions sur google

Conversion double en BigDecimal en Java

Impossible d'accéder à la vue personnalisée pendant le test de l'interface utilisateur dans XCode

Algorithme: diviser de manière optimale une chaîne en 3 sous-chaînes

Passer la taille d'un tableau 2D à une fonction ?

Comment obtenir l'intégration contextuelle d'une phrase dans une phrase à l'aide de BERT ?

Comment changer le navigateur par défaut en Microsoft Edge pour Jupyter Notebook sous Windows 10 ?

CSS: before ne fonctionne pas sur certains éléments,: after fonctionne très bien

Comment créer un bot à compte à rebours dans Discord en utilisant Python

Comment ajouter une entrée à une table de base de données pour une combinaison de deux tables

Exporter la table de l'arborescence vers CSV avec mise en forme

Comment activer le message Pylint "too-many-locals" dans VS Code?

Créer un système Buzzer à l'aide de python

Spring @RequestParam DateTime format comme ISO 8601 Date Heure facultative

Empêcher l'allocation de mémoire dans la génération de combinaison récursive

Déplacement des moindres carrés d'ajustement pour les déplacements de points ayant des problèmes

Comment choisir le nombre de fragments et de répliques Elasticsearch

Microsoft.WebApplication.targets