我需要为3D卷积网络中的后续步骤进行预处理的一些数据。数据以以下格式存储:
POSITION
x y z (feature 1 x) (feature 1 y) (feature 1 z) (feature 2 x) (feature 2 y ...
1.2 0.54 2.3 0.04 0.2 -0.9 -0.2 0.65 ...
...(more rows of the same format)...
在执行涉及位置数据和特征的其他一些步骤之后,我得到了一个带有维度的pytorch张量[height][width][depth][features]
,或者等效地是一个numpy数组,其中前三个是位置数据,我可以使用它们使用颜色来绘制特征,并且[features]
是包含每个特征值的向量。
这些是非常大的文件,我不想在处理过程中稍后执行从上面显示的第一种文件格式到张量/数组形式的转换。我正在考虑使用torch.save(tensor, 'file.pt')
。
我的问题是:保存此数据的最佳文件格式是什么,以便以后无需任何预处理即可轻松访问?必须使用PyTorch对其进行序列化似乎是一种令人费解的保存数据类型的方法,我希望它具有更特定的/指定的文件格式。
我想我找到了一种更直接的方法。Numpy支持将其数组另存为.npy
文件。
该过程非常简单。要将数组保存array_1
到文件中numpy_array_1.npy
,您需要做的是:
np.save('numpy_array_1.npy', array_l)
然后将其加载到array_2
:
array_2 = np.load('numpy_array_1.npy')
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句