Concat Avro files in Google Cloud Storage

Marcus Sandri

I have some big .avro files in the Google Cloud Storage and I want to concat all of them in a single file.

I got

java -jar avro-tools.jar concat

However, as my files are in the google storage path: gs://files.avro I can't concat them by using avro-tools. Any suggestion about how to solve it?

Donnald Cucharo

You can use the gsutil compose command. For example:

gsutil compose gs://bucket/obj1 [gs://bucket/obj2 ...] gs://bucket/composite

Note: For extremely large files and/or very low per-machine bandwidth, you may want to split the file and upload it from multiple machines, and later compose these parts of the file manually.

On my case I tested it with the following values: foo.txt contains a word Hello and bar.txt contains a word World. Running this command:

gsutil compose gs://bucket/foo.txt gs://bucket/bar.txt gs://bucket/baz.txt

baz.txt would return:

Hello
World

Note: GCS does not support inter-bucket composing.

Just in case if you're encountering an exception error with regards to integrity checks, run gsutil help crcmod to get an instructions on how to fix it.

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

Is it possible to upload files directly to the Google Cloud Storage?

Accessing files from Google cloud storage in RStudio

Struggling to read csv files from Google Cloud Storage bucket

Uploading files to Google Cloud Storage from Localhost or external server

How do I write compressed files to Google Cloud Storage using Google Cloud Dataflow?

Google Appengine Cloud Storage

PHP Google Cloud Storage

Google Cloud Storage Client

Google Cloud Storage

Google Cloud Storage ::制限

Uploading files to Google Cloud Storage using JSON API, Error 401 Unauthorized

Load big file from Google Cloud Storage into Google Cloud Functions?

在 Google Cloud Build 中使用 Google Cloud Storage

Google Cloud Storage returning wrong identity

What is the Google Cloud Storage public read uri?

Google Cloud Storage認証の使用

Generating getServingUrl() in google cloud storage with NodeJs sdk

Google Cloud Storage - Knowing who uploaded

Snowflake Connection to Google Cloud Storage in Australia

How to initialize Google Cloud Storage with credentials

Moving Google Cloud Storage bucket to another project

gsutil zip directory on google cloud storage

Delete a file inside a folder in Google cloud storage

Google Cloud Storage Notification with Pub/Sub and docs

Google Cloud Storage WebUIの制限

How can I upload files to Cloud Storage through Cloud Functions and use Firestore to control access to Cloud Storage?

Google Takeout from G Suite Download from Google Cloud Storage

Google BigQuery, How to load data from google cloud storage to BigQuery

Google Cloud StorageにPOSTすると、$ _ FILES変数が空になるのはなぜですか?

TOP 一覧

  1. 1

    Unity:未知のスクリプトをGameObject(カスタムエディター)に動的にアタッチする方法

  2. 2

    セレンのモデルダイアログからテキストを抽出するにはどうすればよいですか?

  3. 3

    Ansibleで複数行のシェルスクリプトを実行する方法

  4. 4

    tkinterウィンドウを閉じてもPythonプログラムが終了しない

  5. 5

    Crashlytics:コンパイラー生成とはどういう意味ですか?

  6. 6

    GoDaddyでのCKEditorとKCfinderの画像プレビュー

  7. 7

    Windows 10 Pro 1709を1803、1809、または1903に更新しますか?

  8. 8

    Chromeウェブアプリのウェブビューの高さの問題

  9. 9

    モーダルダイアログを自動的に閉じる-サーバーコードが完了したら、Googleスプレッドシートのダイアログを閉じます

  10. 10

    Windows 10の起動時間:以前は20秒でしたが、現在は6〜8倍になっています

  11. 11

    Reactでclsxを使用する方法

  12. 12

    ファイル内の2つのマーカー間のテキストを、別のファイルのテキストのセクションに置き換えるにはどうすればよいですか?

  13. 13

    MLでのデータ前処理の背後にある直感

  14. 14

    グラフからテーブルに条件付き書式を適用するにはどうすればよいですか?

  15. 15

    Pythonを使用して同じ列の同じ値の間の時差を取得する方法

  16. 16

    mutate_allとifelseを組み合わせるにはどうすればよいですか

  17. 17

    ネットワークグラフで、ネットワークコンポーネントにカーソルを合わせたときに、それらを強調表示するにはどうすればよいですか?

  18. 18

    テキストフィールドの値に基づいて UIslider を移動します

  19. 19

    BLOBストレージからデータを読み取り、Azure関数アプリを使用してデータにアクセスする方法

  20. 20

    PowerShellの分割ファイルへのヘッダーの追加

  21. 21

    ソートされた検索、ターゲット値未満の数をカウント

ホットタグ

アーカイブ