将列表另存为python中的文件(该文件也应被其他编程语言接受)

Sandiip

我有一个int8数据类型的3维列表,我想将其保存到txt文件中。我如何保存文件,以便将值另存为int8而不是字符串,这会减小txt文件的大小。我在用python做

雷吉斯B.

为了节省空间,您需要以二进制格式存储数据。这可以通过泡菜模块来实现

例如,让我们以二进制和文本格式保存1000个整数的列表:

>>> from random import randint
>>> import pickle
>>> l = [randint(0, 100000) for i in range(0, 1000)]
>>> bf = open("out.bin", "wb") # binary file
>>> tf = open("out.txt", "w")  # ASCII file
>>> pickle.dump(l, bf, -1) # write file with highest possible protocol (binary)
>>> for i in l:
...     tf.write(str(i) + " ")
>>> bf.close()
>>> tf.close()

二进制文件的权重为3.7 kb,而文本文件的权重为5.8 kb:

$ ls -lh out*
-rw-rw-r-- 1 regis regis 3,7K janv. 18 10:16 out.bin
-rw-rw-r-- 1 regis regis 5,8K janv. 18 10:14 out.txt

如果您的目标是减小文件大小并以另一种语言(或另一种操作系统)读回文件,那么有许多解决方案比序列化为二进制格式更有效。您只是遇到文件压缩问题。在python中,写入gzip压缩文件很容易,并且从gzip压缩文件中读取文件非常标准,因此您应该以目标语言找到合适的库。

以下是将128 * 128 * 128列表写入gzip压缩文件的方法:

l = [randint(0, 100000) for _ in range(0, 128*128*128)]
with gzip.open("out.txt.gz", "w") as tfz:
    tfz.write(" ".join([str(i) for i in l]))

这样就产生了5.5 Mb的二进制文件,而压缩包产生了12 Mb的未压缩文本文件和7.4 Mb的二进制文件pickle

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章