Impossible d'exporter la trame de données CSV pyspark vers C:\temp

ecp

J'ai un pyspark.sql.dataframe.DataFrame avec 1300 lignes et 5 colonnes. J'utilise ce qui suit pour exporter la trame de données vers C:/temp :

c5.toPandas().to_csv("C:/temp/colspark.csv")

Mais j'obtiens l'erreur suivante :

<ipython-input-4-2c57938dba1e> in <module>
----> 1 c5.toPandas().to_csv("C:/temp/colspark.csv")

S:\tdv\ab\ecp\Spark\spark\spark-2.4.4-bin-hadoop2.7\python\pyspark\sql\dataframe.py in toPandas(self)
   2141 
   2142         # Below is toPandas without Arrow optimization.

(...)

Py4JJavaError: An error occurred while calling o689.collectToPython.
: org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 50.0 failed 1 times, most recent failure: Lost task 0.0 in stage 50.0 (TID 2190, localhost, executor driver): org.apache.spark.api.python.PythonException: Traceback (most recent call last)

What I have tried so far:

``spark.conf.set("spark.sql.execution.arrow.enabled", "true")``

But:

``Py4JJavaError                             Traceback (most recent call last)
<ipython-input-5-92bc22b46531> in <module>
      1 spark.conf.set("spark.sql.execution.arrow.enabled", "true")
----> 2 c5.toPandas().to_csv("C:/temp/colspark.csv")

S:\tdv\ab\ecp\Spark\spark-2.4.4-bin-hadoop2.7\python\pyspark\sql\dataframe.py in toPandas(self)
   2120                         _check_dataframe_localize_timestamps
   2121                     import pyarrow
-> 2122                     batches = self._collectAsArrow()
   2123                     if len(batches) > 0:
   2124                         table = pyarrow.Table.from_batches(batches)

S:\tdv\ab\ecp\Spark\spark-2.4.4-bin-hadoop2.7\python\pyspark\sql\dataframe.py in _collectAsArrow(self)
   2182                 return list(_load_from_socket((port, auth_secret), ArrowStreamSerializer()))
   2183             finally:
-> 2184                 jsocket_auth_server.getResult()  # Join serving thread and raise any exceptions````


I even followed some solutions from
https://stackoverflow.com/questions/31937958/how-to-export-data-from-spark-sql-to-csv
But I cannot figure out how to proceed anymore. Is there any way to avoid arrow optimisation? Or I have to use another method to save the CSV file?
Sri_Karthik

Je comprends que vous essayez d'enregistrer le cadre de données Spark dans un fichier csv dans votre répertoire local. SI oui, écrivez comme ci-dessous :

dfname.write.csv("c:\\temp\\csvfoldername")

Cet article est collecté sur Internet, veuillez indiquer la source lors de la réimpression.

En cas d'infraction, veuillez [email protected] Supprimer.

modifier le
0

laisse moi dire quelques mots

0commentaires
connexionAprès avoir participé à la revue

Articles connexes

Impossible d'exporter ma trame de données pandas vers Excel

Impossible d'exporter les données vers CSV ou Excel

Impossible d'exporter plusieurs lignes de la base de données vers XML

Quelle est la bonne façon d'exporter la trame de données Pandas vers un fichier Excel à plusieurs feuilles?

Partition de la trame de données Pyspark OLD vers la nouvelle trame de données

Exporter la table de données de Python vers CSV

Exporter une simple trame de données R vers txt tsv ou csv

Exporter une trame de données vers différents CSV avec 1000 lignes chacun

impossible de convertir la trame de données en CSV

Exporter la trame de données vers un fichier Excel à l'aide de xlsxwriter

Exporter la trame de données pandas vers un dictionnaire imbriqué à partir de plusieurs colonnes

Impossible d'exporter la base de données Azure SQL

exporter le tracé en cascade SHAP vers la trame de données

Impossible d'écrire la trame de données Spark dans un format de fichier parquet sur le lecteur C dans PySpark

La trame de données Pandas vers la trame de données Spark "Erreur de type de fusion impossible"

Comment exporter une base de données de table dans PySpark vers CSV?

est-il possible d'exporter une trame de données R vers CSV avec des lignes vides entre les groupes?

Impossible de charger la trame de données pyspark dans l'algorithme d'arbre de décision. Il dit ne peut pas fonctionner avec la trame de données pyspark

Essayer d'exporter des données de la base de données vers Excel dans Django

Ajustement des données incorrectes d'un fichier CSV dans une trame de données Pyspark

Impossible d'associer la nouvelle trame de données groupby à la trame de données d'origine

Impossible de créer une trame de données à partir de la liste: pyspark

Convertir / exporter la sortie Googleway en trame de données

Exporter une trame de données pandas dans un fichier csv (l'objet 'list' n'a pas d'attribut 'to_csv')

Exporter des données d'Elasticsearch vers CSV à l'aide de Logstash

Comment exporter des données d'une table vers un fichier csv à l'aide de jquery

PostgreSQL: Exporter vers des données csv à partir de la sortie EXECUTE

Exporter les données de datagridview vers csv avec la notation scientifique

Exporter les données JSON de la table MySQL vers CSV

TOP liste

  1. 1

    Microsoft.WebApplication.targets

  2. 2

    Spring @RequestParam DateTime format comme ISO 8601 Date Heure facultative

  3. 3

    comment supprimer "compte de connexion google" à des fins de développement - actions sur google

  4. 4

    Comment ajouter une entrée à une table de base de données pour une combinaison de deux tables

  5. 5

    Passer la taille d'un tableau 2D à une fonction ?

  6. 6

    Exporter la table de l'arborescence vers CSV avec mise en forme

  7. 7

    Impossible d'accéder à la vue personnalisée pendant le test de l'interface utilisateur dans XCode

  8. 8

    Créer un système Buzzer à l'aide de python

  9. 9

    Comment changer le navigateur par défaut en Microsoft Edge pour Jupyter Notebook sous Windows 10 ?

  10. 10

    impossible d'obtenir l'image d'arrière-plan en plein écran dans reactjs

  11. 11

    Algorithme: diviser de manière optimale une chaîne en 3 sous-chaînes

  12. 12

    CSS: before ne fonctionne pas sur certains éléments,: after fonctionne très bien

  13. 13

    Conversion double en BigDecimal en Java

  14. 14

    Comment obtenir l'intégration contextuelle d'une phrase dans une phrase à l'aide de BERT ?

  15. 15

    Comment choisir le nombre de fragments et de répliques Elasticsearch

  16. 16

    Comment vérifier si un utilisateur spécifique a un rôle? Discord js

  17. 17

    Comment créer un bot à compte à rebours dans Discord en utilisant Python

  18. 18

    Existe-t-il un moyen de voir si mon bot est hors ligne ?

  19. 19

    comment afficher un bouton au-dessus d'un autre élément ?

  20. 20

    Comment activer le message Pylint "too-many-locals" dans VS Code?

  21. 21

    Je continue à obtenir l'objet 'WSGIRequest' n'a pas d'attribut 'Get' sur django

chaudétiquette

Archive