如何使用所有可用内存

弗拉基米尔·列宁

我想尽可能多地加载数据，以便当前进程和其他进程都能正常工作。我宁愿只使用RAM（不使用swap），但欢迎任何建议。过多的数据可以被丢弃。正确的做法是什么？如果我只是等待MemoryException，系统将无法运行（如果使用列表）。

data_storage = []
for data in read_next_data():
  data_storage.append(data)

最终将数据加载到numpy数组中。

塞弗特

psutil具有一个virtual_memory函数，该函数除其他外包含一个表示可用内存的属性：

>>> psutil.virtual_memory()
svmem(total=4170924032, available=1743937536, percent=58.2, used=2426986496, free=1743937536)

>>> psutil.virtual_memory().free
1743937536

那应该是非常准确的（但是函数调用是昂贵的-慢-至少在Windows上是如此）。的MemoryError因此，如果阵列的存储超过总缴费（免费或不）RAM它仅提出不采取由其他proccesses考虑存储器。

您可能不得不猜测在哪一点停止累积，因为可用内存可能会发生变化（其他进程也会不时需要一些额外的内存），并且转换为numpy.array临时可能会使您使用的内存增加一倍，因为那时列表和数组必须适合您的RAM。

但是，您也可以采用其他方法来处理此问题：

读入第一个数据集：read_next_data()。
计算此时的可用内存： psutil.virtual_memory().free
使用shape第一个数据集的和dtype计算容易适合RAM的数组的形状。假设它使用factor（即75％）可用的空闲内存：rows= freeMemory * factor / (firstDataShape * memoryPerElement)这应该为您提供一次读取的数据集数量。
创建一个具有该形状的数组：arr = np.empty((rows, *firstShape), dtype=firstDtype)。
加载下一个数据集，但将它们直接存储到数组中arr[i] = next(read_next_data)。这样，您就不会保留这些列表，并且可以避免内存增加一倍。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-5

我来说两句

0 条评论

登录后参与评论

上一篇：ld检查共享库中未解析的符号不是多余的吗？

TOP 榜单

文章

如何使用所有可用内存

如何使用所有可用内存

隐藏发件人没有短信PHP

材质UI垂直滑块。如何改变在垂直材料UI滑块导轨的厚度（反应）

在Windows 7中无法删除文件（2）

HttpClient中的角度变化检测

Azure VM启动/停止日志

如何在 Vb.net 中使用函数返回多个值

Powerpoint-条形长度错误的堆积条形图

最新歌剧断断续续的快速拨号和渲染错误

Mac OS X更新后的GRUB 2问题

需要公式以vlookup逗号分隔单个单元格中的值

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

ggplot：对齐多个分面图-所有大小不同的分面

OS X-为什么我需要打开WiFi才能确定最近的位置

用日期数据透视表和日期顺序查询

Java Eclipse中的错误13，如何解决？

如何在Django中使用UUID

加载Microsoft Visual菜单时出现问题

具有if条件的SQL UPDATE

从JSON到JSONL的Python转换

如何在Kod中更改字体？

共享图像将路径放入地址