Wie zählt man die Anzahl der Vorkommen jedes Wortes in einem Satz für jede Satzpunktzahl?

Kristada673

Ich habe ein Dokument der Benutzerumfrage:

Score    Comment
8        Rapid bureaucratic affairs. Reports for policy...
4        There needs to be communication or feed back f...
7        service is satisfactory
5        Good
5        There is no
10       My main reason for the product is competition ...
9        Because I have not received the results. And m...
5        no reason

Ich möchte bestimmen, welche Keywords einer höheren Punktzahl entsprechen und welche Keywords einer niedrigeren Punktzahl entsprechen.

Meine Idee ist es, eine Tabelle der Wörter (oder ein "Wortvektor" -Wörterbuch) zu erstellen, die die Bewertungen enthält, mit denen sie verknüpft sind, und die Häufigkeit, mit der diese Bewertung diesem Satz zugeordnet wurde.

So etwas wie das Folgende:

Word        Score   Count
Word1:      7       1
            4       2
Word2:      5       1
            9       1
            3       2
            2       1
Word3:      9       3
Word4:      8       1
            9       1
            4       2
...         ...     ...

Dann ist für jedes Wort die durchschnittliche Punktzahl der Durchschnitt aller Punktzahlen, denen dieses Wort zugeordnet ist.

Dazu lautet mein Code wie folgt:

word_vec = {}
# col 1 is the word, col 2 is the score, col 3 is the number of times it occurs

for i in range(len(data)):
    sentence = data['SurveyResponse'][i].split(' ')
    for word in sentence:
        word_vec['word'] = word
        if word in word_vec:
            word_vec[word] = {'Score':data['SCORE'][i], 'NumberOfTimes':(word_vec[word]['NumberOfTimes'] += 1)}
        else:
            word_vec[word] = {'Score':data['SCORE'][i], 'NumberOfTimes':1}

Aber dieser Code gibt mir den folgenden Fehler:

File "<ipython-input-144-14b3edc8cbd4>", line 9
    word_vec[word] = {'Score':data['SCORE'][i], 'NumberOfTimes':(word_vec[word]['NumberOfTimes'] += 1)}
                                                                                                  ^
SyntaxError: invalid syntax

Könnte mir bitte jemand den richtigen Weg zeigen?

Ashish Prakash

Probieren Sie diesen Code aus

word_vec = {}
# col 1 is the word, col 2 is the score, col 3 is the number of times it occurs

for i in range(len(data)):
    sentence = data['SurveyResponse'][i].split(' ')
    for word in sentence:
        word_vec['word'] = word
        if word in word_vec:
            word_vec[word]['Score'] += data['SCORE'][i] # Keep accumulating the total score for each word, would be easier to find the average score later on
            word_vec[word]['NumberOfTimes'] += 1
        else:
            word_vec[word] = {'Score':data['SCORE'][i], 'NumberOfTimes':1}

Um den Wert von 'NumberOfTimes' zu erhöhen, können Sie dies direkt direkt erhöhen word_vec[word]['NumberOfTimes'] += 1

Dieser Artikel stammt aus dem Internet. Bitte geben Sie beim Nachdruck die Quelle an.

Bei Verstößen wenden Sie sich bitte [email protected] Löschen.

bearbeiten am
0

Lass mich ein paar Worte sagen

0Kommentare
LoginNach der Teilnahme an der Überprüfung

Verwandte Artikel

Zählen Sie die Anzahl der Vorkommen jedes Wortes

Zählen Sie die Anzahl der Vorkommen jedes Wortes in einem Text - Python

Wie man die Anzahl der Wörter in einem Satz zählt und an eine Liste anhängt

Wie zählt man die Anzahl der Wörter in einem Satz, ignoriert Zahlen, Satzzeichen und Leerzeichen?

Wie zählt man die Anzahl der Vorkommen eines bestimmten Teilstrings in einem SQL-Varchar?

Wie kann man die Anzahl der Vorkommen eines Wortes in einer Pandas-Spalte zählen?

So wird die Anzahl der täglichen Vorkommen für jedes Element in einem Datenrahmen gezählt

wie man die Anzahl der Wörter für jede Spalte zählt, die sich in Pandas in Array-Struktur befindet

Java-Programm, um die Anzahl der Buchstaben jedes Wortes in einem Satz zu finden

MYSQL Wie man die Länge jedes Wortes in der Textspalte zählt

Wie zähle ich die Anzahl der Vorkommen für jede Gruppe in einer aufgeräumten Datentabelle?

Wie zählt man die Anzahl der gleichen Elemente, die in einem Vektor in R in Ordnung sind?

So zählen Sie effizient die Anzahl der Vorkommen jedes Wortes in Python

Python, wie man die Anzahl der Vorkommen zählt, die aus einer anderen Eingabedatei extrahiert wurden

Wie man die Anzahl der geordneten Sequenzen in einem Vektor in R zählt

Wie man die Anzahl der Beobachtungen in einem "n" -Dimensionsbereich in R zählt

Wie zählt man die Anzahl der Elemente in einer Liste in einem Datenrahmen in R?

Scala-Paare: wie man die Anzahl der Vorkommen im Wert zählt (Zahlenliste)

Wie man die Anzahl der Tage in R . zählt

Wie werden Vorkommen jedes einzelnen Werts für jede Spalte in einem Datenrahmen gezählt?

Ermitteln Sie für jedes Wort die Anzahl der Sätze, die in einem bestimmten Text vorkommen

Wie zähle ich die Anzahl der Vorkommen eines Wortes in verschiedenen Dateien? -BASH

Wie zähle ich die Anzahl der Buchstaben für jede Spalte in einem String [][]?

Wie zählt man die Anzahl der Besucher für die Website in asp.net? c #

dplyr: lubridate: Wie man die Anzahl der Vorkommen pro Woche zählt und auf die täglichen Daten verteilt

Zählen Sie die Anzahl der Vorkommen für jede Position in der verschachtelten Liste

iccube: Wie zählt man die Anzahl der Mitglieder mit der where-Klausel in einem mdx?

Zähle die Anzahl der Vorkommen für jede n Zeile in R

Wie kann man die Anzahl der Vorkommen von Datenkombinationen zählen und in einer Matrix in R speichern?

TOP Liste

  1. 1

    So legen Sie mit dem Interface Builder unterschiedliche führende Speicherplätze für unterschiedliche Geräte fest

  2. 2

    Fügen Sie eine weitere Schaltfläche zu gwt Suggest Box hinzu

  3. 3

    Wie konvertiere ich einen Vektor von Bytes (u8) in eine Zeichenfolge?

  4. 4

    Wie kann ich in SCSS mehrere Klassen zu einer einzigen kombinieren?

  5. 5

    Wie konvertiert man einen Datenrahmen im langen Format in eine Liste mit einem geeigneten Format?

  6. 6

    Speichern Sie ein MPAndroidChart-Diagramm in einem Bild, ohne es in einer Aktivität anzuzeigen

  7. 7

    Gruppieren Sie Datenrahmenspalten nach ihrem Datum (die Spaltentitel enthalten) und fassen Sie die Instanzen von Einsen und Nullen in R . zusammen

  8. 8

    Tomcat - Leiten Sie den alten Kontextstamm zum neuen Kontextstamm um

  9. 9

    Eclipse Oxygen - Projekte verschwinden

  10. 10

    Wie wählt man Unterschiede mit drei Tabellen aus?

  11. 11

    Tic Tac Toe-Spiel im React-Reset-Button funktioniert nicht

  12. 12

    So berechnen Sie die Verfügbarkeit von Anwendungen (SLA)

  13. 13

    ElasticSearch BulkShardRequest ist aufgrund von org.elasticsearch.common.util.concurrent.EsThreadPoolExecutor fehlgeschlagen

  14. 14

    Wie kann ich den Kaskadenmodus global einstellen?

  15. 15

    Python: Spalten mit demselben Namen zusammenführen, wobei der Mindestwert beibehalten wird

  16. 16

    So erhalten Sie eine gleichmäßige Höhe für alle Eingabefelder

  17. 17

    Wie erstelle ich einen neuen übergeordneten Knoten außerhalb der .ref (/ path) in der Firebase-Echtzeitdatenbank mithilfe von Cloud-Funktionen (Typescript)?

  18. 18

    Was ist schneller: SUM über NULL oder über 0?

  19. 19

    Wie kann ich eine verschachtelte Schleife mit lapply in R ersetzen?

  20. 20

    Kann ich ein Tkinter-Canvas erstellen, das mehrere Zeilen in einem Text-Widget umfasst?

  21. 21

    Ärgerliches Problem mit yaml, das ich nicht lösen kann

heißlabel

Archiv