Keras CNN 如何减少大图像尺寸的 GPU 内存使用量？

盗贼

我正在尝试训练 cnn-lstm 模型，我的样本图像大小为 640x640。

我有一个 GTX 1080 ti 11GB。

我正在使用带有 tensorflow 后端的 Keras。

这是模型。

img_input_1 = Input(shape=(1, n_width, n_height, n_channels))

conv_1 = TimeDistributed(Conv2D(96, (11,11), activation='relu', padding='same'))(img_input_1)

pool_1 = TimeDistributed(MaxPooling2D((3,3)))(conv_1)

conv_2 = TimeDistributed(Conv2D(128, (11,11), activation='relu', padding='same'))(pool_1)

flat_1 = TimeDistributed(Flatten())(conv_2)

dense_1 = TimeDistributed(Dense(4096, activation='relu'))(flat_1)

drop_1 = TimeDistributed(Dropout(0.5))(dense_1)

lstm_1 = LSTM(17, activation='linear')(drop_1)

dense_2 = Dense(4096, activation='relu')(lstm_1)

dense_output_2 = Dense(1, activation='sigmoid')(dense_2)

model = Model(inputs=img_input_1, outputs=dense_output_2)

op = optimizers.Adam(lr=0.00001, beta_1=0.9, beta_2=0.999, epsilon=1e-08, decay=0.001)

model.compile(loss='mean_absolute_error', optimizer=op, metrics=['accuracy'])

model.fit(X, Y, epochs=3, batch_size=1)

现在使用这个模型，我只能在图像被调整到 60x60 时使用训练数据，任何更大的并且我用完 GPU 内存。

我想使用尽可能大的尺寸，因为我想保留尽可能多的歧视性信息。（y 标签将是 0 - 640 之间的鼠标屏幕坐标）

在许多其他人中，我找到了这个答案：https : //ai.stackexchange.com/questions/3938/how-to-handle-images-of-large-sizes-in-cnn

尽管我不确定如何“限制您的 CNN”或“在每个时代流式传输您的数据”，或者这些是否有帮助。

如何减少使用的内存量，以便增加图像大小？

是否可以牺牲训练时间/计算速度来支持更高分辨率的数据，同时保持模型有效性？

注意：以上模型不是最终的，只是一个基本的支出。

因此hv89

你的Dense层可能会破坏训练。为了提供一些上下文，让我们假设您正在使用640x640x3图像大小。让我们也忘记LSTM层，假设这是一个非时间序列任务（当然，成为一个时间序列问题的复杂性变得更糟）。

这是输出尺寸。

Conv1 -> 640x640x96
Maxpool1-> 210x210x96（应用程序）
Conv2 -> 210x210x128

现在瓶颈来了。然后，您flatten()将输出 -ing 并将其发送到一个Dense层。这个密集层有210x210x128x4096参数（即23,121,100,800）。假设32-bit精度，您的密集层将占用大约 86GB（我希望我的计算是正确的，但我向您保证这不是一个小数字）。

所以你的选择很少。

首先也是最明显的，减少你的Dense图层大小。
减少小批量的大小
减少Conv层的通道深度。
您可能想考虑是否真的希望输入为640x640x3. 根据您要实现的目标，您可能可以使用较小的图像来实现。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-07-26

我来说两句

0 条评论

登录后参与评论

TOP 榜单

文章

Keras CNN 如何减少大图像尺寸的 GPU 内存使用量？

Keras CNN 如何减少大图像尺寸的 GPU 内存使用量？

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用