Hadoop出力をテキストファイルにエクスポートする

ZeExplorer

サンプルのMapReduceプログラムを実行した後、次のようなコマンドで出力を確認します。
hdfs -cat \usr\cloudera\output\part-r-0000

そしてそれはこのように見えます:

ここに画像の説明を入力してください

さらに分析するために、テキストまたはcsvとしてエクスポートする方法を考えていました。分析のためにデータをExcelに入れたいです。Cloudera VM forHadoopを使用しています。

やったhdfs -get \usr\cloudera\output\part-r-0000 \somewhere\results.txtけど中身がめちゃくちゃ。

提案してください。

クリス・ガーケン

最善の策は、コードを変更することです。2つの値の間にコンマを書き込むようにレデューサーを変更すると、CSV形式でデータを取得できます。

もちろん、データはすでにTSV(タブ区切り形式)であるように見えます。これはほとんどのスプレッドシートが理解していることです。

HDFSからデータを取得する場合は、

hdfs -cat \usr\cloudera\output\part-r-0000 >\somewhere\results.txt

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

辞書をテキストファイルにエクスポートする

テキストエクスポートを使用するときに出力ファイル設定ダイアログを無効にする

データフレームをRのテキストファイルにエクスポートする

Jsonオブジェクトをテキストファイルにエクスポートする

FileSystemObjectを使用してVBScriptコードをテキストファイルにエクスポートする

PythonSeleniumリストをテキストファイルにエクスポート

PythonSeleniumリストをテキストファイルにエクスポート

固定長レコードのテキストファイルにデータをエクスポートする

lintr出力をファイルにエクスポートする方法は?

Excelからテキストファイルにデータをエクスポートする

Accessからテキストファイルにデータをエクスポートする方法

行1に引用符を含むテキストファイルをエクスポートする手順-Excel

CSVでインポートしてテキストファイルにエクスポートする

Javascript ::テキストファイルにエクスポート

Excelの列を複数のテキストファイルにエクスポートする

XMLドキュメントをファイルシステムにエクスポートする方法

XMLドキュメントをファイルシステムにエクスポートする方法

PowerShellを使用してSQLServerからjsonテキストファイルにエクスポートする

テキストを新しいファイル、userinputにエクスポートする方法は?

環境変数をテキストファイルにエクスポートする方法

PowerShellエクスポートで2つの文字列をテキストファイルに結合する

部分ビューをテキストファイルにエクスポート

ステータスコードを出力するためにファイルを使用してPythonリクエストをインポートする方法

opensslキーをファイルにエクスポートする

MySQLテーブルをCSVファイルにエクスポートする

mysqlテーブルをファイルにエクスポートする方法

DataGridをテキストファイルにエクスポート

forループ出力をテキストファイルに出力する方法は?

GoogleDataprocクエリの出力をテキストファイルにリダイレクトする

TOP 一覧

  1. 1

    PictureBoxで画像のブレンドを無効にする

  2. 2

    レスポンシブウェブサイトの一番下にスティッキーなナビゲーションバーを作成するのに問題がある

  3. 3

    Rパッケージ「AppliedPredictiveModeling」のインストール中にエラーが発生しました

  4. 4

    Chromeウェブアプリのウェブビューの高さの問題

  5. 5

    HTTPヘッダー 'SOAPAction'の値はサーバーによって認識されませんでした

  6. 6

    Pythonを使用して、リストからデータを読み取り、特定の値をElasticsearchにインデックス付けするにはどうすればよいですか?

  7. 7

    C ++でのcURLとマルチスレッドの使用

  8. 8

    セレンのモデルダイアログからテキストを抽出するにはどうすればよいですか?

  9. 9

    tkinterウィンドウを閉じてもPythonプログラムが終了しない

  10. 10

    STSでループプロセス「クラスパス通知の送信」のループを停止する方法

  11. 11

    Spring @ModelAttributeモデルフィールドマッピング

  12. 12

    Python / SciPyのピーク検出アルゴリズム

  13. 13

    Ansibleで複数行のシェルスクリプトを実行する方法

  14. 14

    テキストフィールドの値に基づいて UIslider を移動します

  15. 15

    tf.nn_conv2dとtf.nn.depthwise_conv2dの違い

  16. 16

    ZScalerと証明書の問題により、Dockerを使用できません

  17. 17

    MLでのデータ前処理の背後にある直感

  18. 18

    Postmanを使用してファイル付きの(ネストされた)jsonオブジェクトを送信する

  19. 19

    java.lang.NoClassDefFoundError:com / sun / istack / tools / DefaultAuthenticator $ Receiver

  20. 20

    Windows 10 Pro 1709を1803、1809、または1903に更新しますか?

  21. 21

    BLOBストレージからデータを読み取り、Azure関数アプリを使用してデータにアクセスする方法

ホットタグ

アーカイブ