サンプルのMapReduceプログラムを実行した後、次のようなコマンドで出力を確認します。
hdfs -cat \usr\cloudera\output\part-r-0000
そしてそれはこのように見えます:
さらに分析するために、テキストまたはcsvとしてエクスポートする方法を考えていました。分析のためにデータをExcelに入れたいです。Cloudera VM forHadoopを使用しています。
やったhdfs -get \usr\cloudera\output\part-r-0000 \somewhere\results.txt
けど中身がめちゃくちゃ。
提案してください。
最善の策は、コードを変更することです。2つの値の間にコンマを書き込むようにレデューサーを変更すると、CSV形式でデータを取得できます。
もちろん、データはすでにTSV(タブ区切り形式)であるように見えます。これはほとんどのスプレッドシートが理解していることです。
HDFSからデータを取得する場合は、
hdfs -cat \usr\cloudera\output\part-r-0000 >\somewhere\results.txt
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加