ファイルの各行に対してシェルスクリプトを並行して実行する

snate

以下に示すようなデータを含む区切り（|）入力ファイル（TableInfo.txt）があります

dbName1|Table1
dbName1|Table2
dbName2|Table3
dbName2|Table4
...

各行を解析し、dbName、TableNameなどの行から引数を渡す実行可能ファイルを呼び出すシェルスクリプト（LoadTables.sh）があります。このプロセスは、SQL Serverからデータを読み取り、それをHDFSにロードします。

while IFS= read -r line;do
    fields=($(printf "%s" "$line"|cut -d'|' --output-delimiter=' ' -f1-))
    query=$(< ../sqoop/"${fields[1]}".sql)
    sh ../ProcessName "${fields[0]}" "${fields[1]}" "$query"
done < ../TableInfo.txt

現在、私のプロセスはファイル内の各行に対して順番に実行されており、ファイル内のエントリ数に基づいて時間がかかります。

プロセスを並行して実行する方法はありますか？xargs / GNU parallel / ampersandおよびwaitオプションの使用について聞いたことがあります。私はそれを構築して使用する方法に精通していません。どんな助けでも大歓迎です。

注：LinuxマシンにGNUパラレルをインストールしていません。したがって、アンパサンドと待機オプションの使用に関するいくつかの短所を聞いたので、xargsが唯一のオプションです。

チャールズ・ダフィー

&背景に移動したい行の終わりにを置きます。コードで使用されているばかげた（バギー）配列分割メソッドをread独自のフィールド分割に置き換えると、次のようになります。

while IFS='|' read -r db table; do
    ../ProcessName "$db" "$table" "$(<"../sqoop/${table}.sql")" &
done < ../TableInfo.txt

... FYI、re：「バギー」について私が意味したこと-

fields=( $(foo) )

...文字列分割だけでなく、foo;の出力でグロブも実行します。したがって、*出力のaは、現在のディレクトリ内のファイル名のリストに置き換えられます。このような名前は、foo[bar]名前のファイルに置き換えることができfoob、fooaまたはfoor、globfailシェルのオプションが失敗した結果に、このような拡張を引き起こす可能性があり、nullglobそれが空の結果につながる可能性がありますシェルオプション。等

GNU xargsがある場合は、次のことを考慮してください。

# assuming you have "nproc" to get the number of CPUs; otherwise, hardcode
xargs -P "$(nproc)" -d $'\n' -n 1 bash -c '
  db=${1%|*}; table=${1##*|}
  query=$(<"../sqoop/${table}.sql")
  exec ../ProcessName "$db" "$table" "$query"
  ' _ < ../TableInfo.txt

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-04-21

コメントを追加

サインイン

前の投稿：Android recyclerviewは、アクティビティの作成ごとに重複する要素を追加します

TOP 一覧

記事

ファイルの各行に対してシェルスクリプトを並行して実行する

ファイルの各行に対してシェルスクリプトを並行して実行する

Unity：未知のスクリプトをGameObject（カスタムエディター）に動的にアタッチする方法

セレンのモデルダイアログからテキストを抽出するにはどうすればよいですか？

Ansibleで複数行のシェルスクリプトを実行する方法

tkinterウィンドウを閉じてもPythonプログラムが終了しない

Crashlytics：コンパイラー生成とはどういう意味ですか？

GoDaddyでのCKEditorとKCfinderの画像プレビュー

Windows 10 Pro 1709を1803、1809、または1903に更新しますか？

Chromeウェブアプリのウェブビューの高さの問題

モーダルダイアログを自動的に閉じる-サーバーコードが完了したら、Googleスプレッドシートのダイアログを閉じます

Windows 10の起動時間：以前は20秒でしたが、現在は6〜8倍になっています

Reactでclsxを使用する方法

ファイル内の2つのマーカー間のテキストを、別のファイルのテキストのセクションに置き換えるにはどうすればよいですか？

MLでのデータ前処理の背後にある直感

グラフからテーブルに条件付き書式を適用するにはどうすればよいですか？

Pythonを使用して同じ列の同じ値の間の時差を取得する方法

mutate_allとifelseを組み合わせるにはどうすればよいですか

ネットワークグラフで、ネットワークコンポーネントにカーソルを合わせたときに、それらを強調表示するにはどうすればよいですか？

テキストフィールドの値に基づいて UIslider を移動します

BLOBストレージからデータを読み取り、Azure関数アプリを使用してデータにアクセスする方法

PowerShellの分割ファイルへのヘッダーの追加

ソートされた検索、ターゲット値未満の数をカウント