Löschen Sie Zeilen mit leeren Zellen aus einem Pandas DataFrame

Amrita Sawant:

Ich habe eine pd.DataFrame, die durch Parsen einiger Excel-Tabellen erstellt wurde. Eine Spalte enthält leere Zellen. Im Folgenden finden Sie beispielsweise die Ausgabe für die Häufigkeit dieser Spalte. In 32320 Datensätzen fehlen Werte für Tenant .

>>> value_counts(Tenant, normalize=False)
                              32320
    Thunderhead                8170
    Big Data Others            5700
    Cloud Cruiser              5700
    Partnerpedia               5700
    Comcast                    5700
    SDP                        5700
    Agora                      5700
    dtype: int64

Ich versuche, Zeilen zu löschen, in denen Tenant fehlt, die .isnull()Option erkennt jedoch die fehlenden Werte nicht.

>>> df['Tenant'].isnull().sum()
    0

Die Spalte hat den Datentyp "Objekt". Was passiert in diesem Fall? Wie kann ich Datensätze löschen, bei denen der Mieter fehlt?

McMath:

Pandas erkennen einen Wert als null, wenn es sich um ein np.nanObjekt handelt, das wie NaNim DataFrame gedruckt wird. Ihre fehlenden Werte sind wahrscheinlich leere Zeichenfolgen, die Pandas nicht als null erkennt. Um dies zu beheben, können Sie die leeren Stiche (oder was auch immer sich in Ihren leeren Zellen befindet) np.nanmithilfe von Objekten in Objekte konvertieren replace()und dann dropna()Ihren DataFrame aufrufen, um Zeilen mit null Mandanten zu löschen.

Zur Demonstration erstellen wir einen DataFrame mit einigen zufälligen Werten und einigen leeren Zeichenfolgen in einer TenantsSpalte:

>>> import pandas as pd
>>> import numpy as np
>>> 
>>> df = pd.DataFrame(np.random.randn(10, 2), columns=list('AB'))
>>> df['Tenant'] = np.random.choice(['Babar', 'Rataxes', ''], 10)
>>> print df

          A         B   Tenant
0 -0.588412 -1.179306    Babar
1 -0.008562  0.725239         
2  0.282146  0.421721  Rataxes
3  0.627611 -0.661126    Babar
4  0.805304 -0.834214         
5 -0.514568  1.890647    Babar
6 -1.188436  0.294792  Rataxes
7  1.471766 -0.267807    Babar
8 -1.730745  1.358165  Rataxes
9  0.066946  0.375640         

Jetzt ersetzen wir alle leeren Zeichenfolgen in der TenantsSpalte durch np.nanObjekte wie folgt:

>>> df['Tenant'].replace('', np.nan, inplace=True)
>>> print df

          A         B   Tenant
0 -0.588412 -1.179306    Babar
1 -0.008562  0.725239      NaN
2  0.282146  0.421721  Rataxes
3  0.627611 -0.661126    Babar
4  0.805304 -0.834214      NaN
5 -0.514568  1.890647    Babar
6 -1.188436  0.294792  Rataxes
7  1.471766 -0.267807    Babar
8 -1.730745  1.358165  Rataxes
9  0.066946  0.375640      NaN

Jetzt können wir die Nullwerte löschen:

>>> df.dropna(subset=['Tenant'], inplace=True)
>>> print df

          A         B   Tenant
0 -0.588412 -1.179306    Babar
2  0.282146  0.421721  Rataxes
3  0.627611 -0.661126    Babar
5 -0.514568  1.890647    Babar
6 -1.188436  0.294792  Rataxes
7  1.471766 -0.267807    Babar
8 -1.730745  1.358165  Rataxes

Dieser Artikel stammt aus dem Internet. Bitte geben Sie beim Nachdruck die Quelle an.

Bei Verstößen wenden Sie sich bitte [email protected] Löschen.

bearbeiten am
0

Lass mich ein paar Worte sagen

0Kommentare
LoginNach der Teilnahme an der Überprüfung

Verwandte Artikel

Zeilen mit leeren Zellen überspringen / löschen

Löschen Sie Zeilen aus einem Pandas-DataFrame basierend auf einem bedingten Ausdruck mit len (Zeichenfolge), der KeyError gibt

So behalten Sie Zeilen mit leeren (Nan) Zellen bei, wenn Sie Groupby in einem Datenrahmen in Python-Pandas ausführen

Löschen Sie Zeilen mit leeren Feldern

Löschen Sie Nullzeilen mit einem dtype-Objekt aus einem DataFrame mit Pandas

So löschen Sie Zeilen mit einem Schlüsselwort aus Spalten in Pandas

pandas: druckt alle nicht leeren Zeilen aus einem DataFrame

Löschen Sie alle leeren Zellen in einem Zellenarray

Löschen Sie Zeilen aus QTreeView mit einem benutzerdefinierten Modell

jsGrid lädt Zeilen mit leeren Zellen

Wie filtere ich Zeilen mit leeren Listen in einem Pandas DataFrame?

Löschen Sie NaN mit Zeilen in Pandas DataFrame mit Spaltenbedingung

Löschen Sie Zeilen in Pandas mit einem regulären Ausdruck

Löschen Sie in PySpark Zeilen aus einem Datenrahmen, die mit Zeilen aus einem zweiten Datenrahmen übereinstimmen

Es können keine Zeilen mit leeren Zellen in Pandas Dataframe mit SQLite ausgewählt werden

Suche nach einem Code zum Löschen von '!' aus Zellen in einem bestimmten Bereich mit Pandas

Löschen Sie alle Zeilen mit einer leeren Zelle an einer beliebigen Stelle in der Tabelle gleichzeitig in Pandas

Löschen Sie doppelte Zeilen aus einem Pandas DataFrame, dessen Zeitstempel innerhalb eines bestimmten Bereichs oder einer bestimmten Dauer liegen

Wie lösche ich Zeilen mit mehr als einem bestimmten Schwellenwert von leeren Zellen?

Löschen Sie nicht numerische Spalten aus einem Pandas DataFrame

So löschen Sie einen Bruchteil von Zeilen mit einem bestimmten Attributwert aus dem Pandas-Datenrahmen

So löschen Sie eine Datei mit einem leeren Namen aus S3

UITableView hinterlässt nach dem Löschen einer oder mehrerer Zeilen ein Muster aus leeren Zellen

Löschen Sie mehrere Zeilen mit einer Schleife und einem Grepl aus einem großen Datensatz

Pandas - Löschen Sie doppelte Zeilen aus einem DataFrame basierend auf einer Bedingung aus einer Serie, indem Sie priorisierte Werte beibehalten

Pandas DataFrames: So löschen Sie Zeilen in einem Dataframe basierend auf einem sequentiellen Vergleich ihrer Indexwerte

Ersetzen Sie Pandas mit leeren Zeilen

Löschen Sie Zeilen mit einem Fragezeichen in einer beliebigen Spalte in einem Pandas-Datenrahmen

Löschen Sie alle Zeilen aus DataFrame, in denen alle Werte außer einem bestimmten NaN sind

TOP Liste

  1. 1

    Glassfish v3.0.1 im Vergleich zu Oracle GlassFish Server 3.0.1 - Gibt es einen technischen Grund, die kommerzielle Version zu verwenden?

  2. 2

    Wie schließe ich mehrere Ordner mit der Variablen EXTRA_ARGS aus?

  3. 3

    Python: Spalten mit demselben Namen zusammenführen, wobei der Mindestwert beibehalten wird

  4. 4

    Modbus Python Schneider PM5300

  5. 5

    Ärgerliches Problem mit yaml, das ich nicht lösen kann

  6. 6

    Wie kann eine gleichmäßige Lastverteilung in ElasticSearch mit Indizes mit unterschiedlicher Anzahl von Shards erreicht werden?

  7. 7

    Wie füge ich eine Spalte in einer Zeile in der Ansible Jinja2-Vorlage mit der for-Schleife hinzu?

  8. 8

    ElasticSearch - Knotensperren konnten nicht abgerufen werden

  9. 9

    Unity Build-Fehler: Der Name 'EditorUtility' ist im aktuellen Kontext nicht vorhanden

  10. 10

    Wie vergleicht man scala.xml-Knoten richtig?

  11. 11

    Wie kann man eine Multi-Container-Anwendung in Steuerkarten erstellen?

  12. 12

    Wie Verwenden von Httpclient mit jedem SSL-Zertifikat, egal wie „schlecht“ es ist

  13. 13

    HTTPS-Verbindung mit Moneris-Servern in Curl

  14. 14

    Elasticsearch startet nicht nach dem Laden in viele Daten

  15. 15

    Schneller Algorithmus zum Suchen nach Teilzeichenfolgen in einer Zeichenfolge

  16. 16

    So übergeben Sie eine Variable in json, um Daten zu erhalten

  17. 17

    Hervorheben der SQL-Syntax in Visual Studio 2017

  18. 18

    Unterschied zwischen einfachen und doppelten Anführungszeichen in Javascript

  19. 19

    ElasticSeach Auto Complete mit dem Vervollständigungsvorschlag, um das vollständige Dokument zurückzugeben

  20. 20

    Wie kann ich eine verschachtelte Schleife mit lapply in R ersetzen?

  21. 21

    Bester Crawler, um festzustellen, ob er mit Technologien gebaut wurde?

heißlabel

Archiv