Kopieren von Dateien von einem Azure-Speicherkonto in ein anderes mit PySpark

Cornel Verster

Ich versuche, Dateien, deren Namen bestimmten Kriterien entsprechen, von einem Azure-Speicherkonto (alle im Data Lake-Speicher) in ein anderes zu kopieren. Ich versuche derzeit, dies mit PySpark zu tun. Ich liste die Ordner auf, die ich mir ansehen möchte, richte dann Spark für den "Von"-Datalake ein und verwende dbutils, um die Dateien in den relevanten Ordnern abzurufen:

spark.conf.set("fs.azure.account.key."+dev_storage_account_name+".dfs.core.windows.net",dev_storage_account_access_key)

for folder in raw_folders:
    list_of_files = dbutils.fs.ls("abfss://[email protected]/" + folder)

Jetzt kann ich überprüfen, ob die Dateinamen den Bedingungen zum Kopieren entsprechen, aber wie kann ich meine Liste der gewünschten Dateien tatsächlich in Ordner in meinem "to"-Datalake verschieben?

KarthikBhyresh-MT

Sie müssen beide Container mounten und wie folgt verwenden, um Dateien zwischen Dateisystemen zu verschieben:

Ersetzen Sie in der Schleife für jede Iteration das Dateinamenfeld durch jedes Element im Array list_of_files

dbutils.fs.mv('abfss://<container-name>@<storage-account-name>.dfs.core.windows.net/<directory-name>/demo/test.csv', 'abfss://<container-name>@<storage-account-name>.dfs.core.windows.net/<directory-name>/destination/renamedtest.csv')

Ebenfalls....

Wenn Container nicht öffentlich sind (/ wenn es sich um den Stammordner handelt), verwenden Sie dbfs cli, um Dateien/Ordner zwischen den zuvor erstellten Einhängepunkten zu verschieben.

dbfs mv /mnt/folder1 /mnt/folder2

Wenn die Zugriffsebene der Container "anonymer Lesezugriff für Container und Blobs" ist, sollten Sie Dateien direkt verschieben können, ohne sogar Mounts zu erstellen.

Im Databricks-Notizbuch sollte der Code etwa so aussehen -

%fs mv /mnt/folder1 /mnt/folder2

Dieser Artikel stammt aus dem Internet. Bitte geben Sie beim Nachdruck die Quelle an.

Bei Verstößen wenden Sie sich bitte [email protected] Löschen.

bearbeiten am
0

Lass mich ein paar Worte sagen

0Kommentare
LoginNach der Teilnahme an der Überprüfung

Verwandte Artikel

AzCopy - So kopieren Sie ALLE Blobs von einem Speicherkonto in ein anderes rekursiv, beginnend mit root$

Kopieren mehrerer Dateien von einem Unterverzeichnis in ein anderes mit Platzhaltern

VHD von einem Speicherkonto in ein anderes Speicherkonto in einem anderen Mandanten kopieren

Azure Pipeline – Kopieren von Dateien von einem Repository in ein anderes Repository mithilfe von YAML

Kopieren von Dateien von einem Projekt in ein anderes in Maven

So automatisieren Sie das Kopieren von Dateien mit Camel von einem Verzeichnis in ein anderes

Kopieren Sie den Seiten-Blob mithilfe der .Net-API startCopy von einem Speicherkonto in ein anderes Speicherkonto

Kopieren Sie JSON-Dateien von einem Verzeichnis in ein anderes

Powershell: So kopieren Sie Dateien von einem Verzeichnis in ein anderes

Alle Dateien mit Platzhalterzeichen von einem Docker-Volume auf ein anderes kopieren?

So kopieren Sie Dateien mit einer bestimmten Erweiterung unter Linux von einem Verzeichnis in ein anderes

Kopieren von Daten von einem Blatt in ein anderes mit Bedingungen

Verschieben von Dateien mit Pyspark von einem Verzeichnis in ein anderes Verzeichnis in HDFS

Azure kopiert Blobs von einem Speicherkonto in ein anderes im selben Abonnement mithilfe der Rest-API

Azure: Archivblobs können nicht von einem Speicherkonto auf ein anderes kopiert werden?

Kopieren Sie rekursiv eine Reihe von Dateien in PowerShell von einem Verzeichnis in ein anderes

Shell-Skript zum Kopieren von Dateien von einem Verzeichnis in ein anderes

PowerShell-Skript zum Kopieren von Dateien von einem Verzeichnis in ein anderes

Verschieben Sie mit Paramiko Dateien von einem Verzeichnis in ein anderes

Verschieben aller Dateien mit Python von einem Verzeichnis in ein anderes

So kopieren Sie alle Dateien in einem Bash-Skript von einem Verzeichnis in ein anderes

Kopieren Sie mehrere Dateien von der Linux-Shell aus einem Verzeichnis in ein anderes

Kopieren Sie alle Dateien von einem FTP-Verzeichnis in ein anderes

Shell-Skript die Anzahl der Dateien anzuzeigen, die von einem Verzeichnis in ein anderes kopieren

So kopieren Sie bestimmte Dateien von einem Git-Repository in ein anderes und bewahren den Verlauf

Unix-Befehl zum Kopieren der eindeutigen Dateien von einem Verzeichnis in ein anderes Verzeichnis

Kopieren Sie Push-Dateien automatisch von einem GitHub-Repository in ein anderes

Eine Möglichkeit, Dateien von einem Caprover-Image in ein anderes zu kopieren

So kopieren Sie alle Dateien von einem Verzeichnis in ein anderes, mit Ausnahme derer, die mit einer bestimmten Zeichenfolge in einem Bash-Skript beginnen

TOP Liste

  1. 1

    So legen Sie mit dem Interface Builder unterschiedliche führende Speicherplätze für unterschiedliche Geräte fest

  2. 2

    Fügen Sie eine weitere Schaltfläche zu gwt Suggest Box hinzu

  3. 3

    Wie konvertiere ich einen Vektor von Bytes (u8) in eine Zeichenfolge?

  4. 4

    Wie kann ich in SCSS mehrere Klassen zu einer einzigen kombinieren?

  5. 5

    Wie konvertiert man einen Datenrahmen im langen Format in eine Liste mit einem geeigneten Format?

  6. 6

    Speichern Sie ein MPAndroidChart-Diagramm in einem Bild, ohne es in einer Aktivität anzuzeigen

  7. 7

    Gruppieren Sie Datenrahmenspalten nach ihrem Datum (die Spaltentitel enthalten) und fassen Sie die Instanzen von Einsen und Nullen in R . zusammen

  8. 8

    Tomcat - Leiten Sie den alten Kontextstamm zum neuen Kontextstamm um

  9. 9

    Eclipse Oxygen - Projekte verschwinden

  10. 10

    Wie wählt man Unterschiede mit drei Tabellen aus?

  11. 11

    Tic Tac Toe-Spiel im React-Reset-Button funktioniert nicht

  12. 12

    So berechnen Sie die Verfügbarkeit von Anwendungen (SLA)

  13. 13

    ElasticSearch BulkShardRequest ist aufgrund von org.elasticsearch.common.util.concurrent.EsThreadPoolExecutor fehlgeschlagen

  14. 14

    Wie kann ich den Kaskadenmodus global einstellen?

  15. 15

    Python: Spalten mit demselben Namen zusammenführen, wobei der Mindestwert beibehalten wird

  16. 16

    So erhalten Sie eine gleichmäßige Höhe für alle Eingabefelder

  17. 17

    Wie erstelle ich einen neuen übergeordneten Knoten außerhalb der .ref (/ path) in der Firebase-Echtzeitdatenbank mithilfe von Cloud-Funktionen (Typescript)?

  18. 18

    Was ist schneller: SUM über NULL oder über 0?

  19. 19

    Wie kann ich eine verschachtelte Schleife mit lapply in R ersetzen?

  20. 20

    Kann ich ein Tkinter-Canvas erstellen, das mehrere Zeilen in einem Text-Widget umfasst?

  21. 21

    Ärgerliches Problem mit yaml, das ich nicht lösen kann

heißlabel

Archiv