如何将本地ORC文件转换为CSV?

马丁·托马

我的本地计算机上有一个ORC文件,我需要任何合理的格式(例如CSV,JSON,YAML等)。

如何将ORC转换为CSV?

马丁·托马
  1. 下载
  2. 解压缩文件,转到java文件夹并执行Maven:mvn install
  3. 使用ORC工具

这就是我使用它们的方式-您可能需要调整路径:

java -jar ~/.m2/repository/org/apache/orc/orc-tools/1.5.4/orc-tools-1.5.4-uber.jar data ~/your_file.orc > output.json

输出为JSON Lines,可以轻松转换为CSV。首先,我需要从输出中删除最后两行。然后:

import pandas as pd

df = pd.read_json('output.json', lines=True)
df.to_csv('output.csv')

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章