Erstellen Sie eine Hot-Encoding-Spalte basierend auf einem Teil des Werts der anderen Spalte

Dzakyputra

Ich habe diese Art von Datenrahmen.

import pandas as pd

df = pd.DataFrame({'year': [1894, 1976, 1995, 2001, 1993]})

Die jetzige dataframe

    year
0   1894
1   1976
2   1995
3   2001
4   1993

Wie kann ich effektiv eine Hot-Codierungsspalte hinzufügen, damit der Datenrahmen so aussieht?

Das erwartete dataframe

    year    1800s   1900s   2000s
0   1894      1       0       0
1   1976      0       1       0
2   1995      0       1       0
3   2001      0       0       1
4   1993      0       1       0

Ich habe den folgenden Code bereits ausprobiert und es hat funktioniert. Aber ich denke, es gibt eine bessere Lösung. Können Sie mir empfehlen, welche Funktion ich verwenden kann? Vielen Dank!

Der Code

df['year'] = df['year'].astype(str)

df['1800s'] = df['year'].apply(lambda x: 1 if x[:2] == '18' else 0)
df['1900s'] = df['year'].apply(lambda x: 1 if x[:2] == '19' else 0)
df['2000s'] = df['year'].apply(lambda x: 1 if x[:2] == '20' else 0)
Jezreel

Verwenden Sie die Ganzzahldivision für die ersten 2 Ziffern mit get_dummies, benennen Sie die Spaltennamen um DataFrame.add_suffixund benennen Sie sie zuletzt DataFrame.joinzum Hinzufügen zum Original:

df = df.join(pd.get_dummies(df['year'] // 100).add_suffix('00s'))
print (df)
   year  1800s  1900s  2000s
0  1894      1      0      0
1  1976      0      1      0
2  1995      0      1      0
3  2001      0      0      1
4  1993      0      1      0

print (df['year'] // 100)
0    18
1    19
2    19
3    20
4    19
Name: year, dtype: int64

print (pd.get_dummies(df['year'] // 100).add_suffix('00s'))
   1800s  1900s  2000s
0      1      0      0
1      0      1      0
2      0      1      0
3      0      0      1
4      0      1      0

Dieser Artikel stammt aus dem Internet. Bitte geben Sie beim Nachdruck die Quelle an.

Bei Verstößen wenden Sie sich bitte [email protected] Löschen.

bearbeiten am
0

Lass mich ein paar Worte sagen

0Kommentare
LoginNach der Teilnahme an der Überprüfung

Verwandte Artikel

pyspark: Erstellen Sie eine Spalte basierend auf einem String, der in einer anderen Spalte enthalten ist

Erstellen Sie eine neue Spalte basierend auf der Bedingung aus einer Spalte in einem anderen Dataset

Erstellen Sie eine Spalte basierend auf einem anderen Spaltenwert, basierend auf der Zuweisung eines Werts zu Sätzen von Zeichenfolgenwerten aus der Eingabespalte

Erstellen Sie eine neue Spalte basierend auf kumulativen Vorkommen eines bestimmten Werts in einer anderen Spalte Pandas

Erstellen Sie eine Spalte in einem Datenrahmen basierend auf einer anderen Spalte in einem anderen Datenrahmen in R.

Erstellen Sie eine neue Spalte basierend auf der Datumsbedingung in einem anderen Datenrahmen

Pandas - Erstellen Sie eine neue Spalte mit einem Wert basierend auf dem Namen der anderen Spalten

Erstellen Sie neue Spalten basierend auf einem Teil einer Beobachtung in einer anderen Spalte in r

Erstellen Sie eine Spalte mit einem Wert aus einer anderen Spalte basierend auf einer Bedingung

Erstellen Sie eine Spalte basierend auf einer anderen Spalte in einem Datenrahmen in R

Ändern des Werts in der Datenrahmenspalte basierend auf einer anderen Spalte

So erstellen Sie eine Spalte basierend auf Werten in den Zeilen unter der Zeile in einer anderen Spalte

Erstellen Sie eine neue Spalte basierend auf der Zeichenfolge einer anderen Spalte

Erstellen Sie eine Spalte basierend auf der Berechnung einer anderen Spalte

Erstellen Sie eine neue Spalte basierend auf den letzten 2 Ziffern der Werte in einer anderen Spalte

Erstellen Sie eine Spalte, die die historische Existenz eines bestimmten Werts basierend auf einer anderen Spalte angibt

Erstellen Sie eine neue Spalte basierend auf der Anzahl der Zeilen, die dem Wert in einem anderen Datenrahmen entsprechen

Erstellen Sie eine neue Spalte basierend auf der vorherigen Spalte

Erstellen Sie eine Pandas-Spalte basierend auf der n-ten Wiederholung eines Werts

Erstellen Sie eine Pandas-Spalte basierend auf einem Suchwert aus einem anderen Datenrahmen

Erstellen Sie einen Datenrahmen aus einem anderen, der eine hierarchische Taxonomie basierend auf einer Spalte enthält

Erstellen Sie Werte für eine Spalte basierend auf Werten in einer anderen Spalte basierend auf der Gruppe

Mutieren Sie eine neue Spalte basierend auf dem Index des nächsten TRUE-Werts aus einer anderen Spalte

Python-Pandas: Erstellen Sie eine neue Spalte basierend auf dem Maximalwert innerhalb der Gruppe, aber unter Verwendung des Werts aus einer zusätzlichen (Zeichenfolge-) Spalte

Fügen Sie einen Teil der Zeichenfolge in eine Spalte ein, basierend auf den Werten einer anderen Spalte (Python Pandas).

Pandas - Erstellen Sie eine Gesamtspalte basierend auf einer anderen Spalte

Erstellen Sie eine Spalte basierend auf anderen Datenrahmenwerten

Erstellen Sie eine Spalte basierend auf bestimmten Werten in anderen Spalten

Erstellen Sie eine neue Spalte basierend auf Duplikaten in anderen Zeilen

TOP Liste

  1. 1

    So verschieben Sie ein Bild in Flutter/Dart mit einem Draggable

  2. 2

    Unity Build-Fehler: Der Name 'EditorUtility' ist im aktuellen Kontext nicht vorhanden

  3. 3

    TypeAhead.js zeigt keine Ausgangsschienen an?

  4. 4

    Deklarieren einer nicht initialisierten Variablen in der Klassendefinition in Python

  5. 5

    Wie kann ich eine verschachtelte Schleife mit lapply in R ersetzen?

  6. 6

    spring-data-jpa: ORA-01795: Die maximale Anzahl von Ausdrücken in einer Liste beträgt 1000

  7. 7

    Warum funktioniert Phantomjs nicht mit dieser Site?

  8. 8

    Interpolieren Sie mit Python die 2D-Matrix entlang der Spalten

  9. 9

    numpy: Berechnen Sie die Ableitung der Softmax-Funktion

  10. 10

    Wie vermeide ich, dass die gesamte App neu geladen wird, wenn Nav.Link von React-Bootstrap verwendet wird?

  11. 11

    MongoDB eingebettetes Dokument unterscheiden und filtern

  12. 12

    Aktualisieren des Werts im Json-Objekt in Python

  13. 13

    Warum funktioniert das Umgebungslicht in diesem Beispiel nicht?

  14. 14

    Python gibt einen Fehler aus, dass eine Datei nicht vorhanden ist, wenn dies eindeutig der Fall ist

  15. 15

    Wie verwende ich Format-Table ohne Abschneiden von Werten?

  16. 16

    So berechnen Sie die Verfügbarkeit von Anwendungen (SLA)

  17. 17

    Überprüfen Sie, ob der ausgewählte Wert 'YES' ist, wenn ja, aktivieren Sie ein Steuerelement mit Javascript

  18. 18

    Python: Spalten mit demselben Namen zusammenführen, wobei der Mindestwert beibehalten wird

  19. 19

    Holen Sie sich verwandte Pillen Inhalt mit angeklickten img in Angular

  20. 20

    Eclipse Oxygen - Projekte verschwinden

  21. 21

    Wie aktualisiere ich ein Feld in einer Raumdatenbank mit einem Repository und einem Ansichtsmodell?

heißlabel

Archiv