我的本地计算机上有一个ORC文件,我需要任何合理的格式(例如CSV,JSON,YAML等)。
如何将ORC转换为CSV?
java
文件夹并执行Maven:mvn install
这就是我使用它们的方式-您可能需要调整路径:
java -jar ~/.m2/repository/org/apache/orc/orc-tools/1.5.4/orc-tools-1.5.4-uber.jar data ~/your_file.orc > output.json
输出为JSON Lines,可以轻松转换为CSV。首先,我需要从输出中删除最后两行。然后:
import pandas as pd
df = pd.read_json('output.json', lines=True)
df.to_csv('output.csv')
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句