我即将在 GPU 服务器上使用 ESPNet 训练我自己的 ASR 模型。如果我的计算是正确的,大约需要连续 4 天(使用大约 100G 的音频数据)。
我主要是用VScode远程连接SSH服务器,会用VScode终端运行shell文件。
我的问题是,我是否必须将笔记本电脑打开四天才能训练我的模型?
不确定这是否有任何有用的信息,但这是我的 nvcc --version:
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2019 NVIDIA Corporation
Built on Wed_Oct_23_19:24:38_PDT_2019
Cuda compilation tools, release 10.2, V10.2.89
和我的 nvidia-smi:
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 440.33.01 Driver Version: 440.33.01 CUDA Version: 10.2 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 Quadro RTX 6000 Off | 00000000:00:06.0 Off | 0 |
| N/A 32C P0 41W / 250W | 0MiB / 22698MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
准备好所有数据后,我将执行 run.sh 文件。Espnet github:https : //github.com/espnet/espnet
我使用的模型位于 espnet/egs2/zeroth_korean/asr1。
我对 linux 服务器相当陌生,并且模型如此庞大和庞大,因此任何类型的反馈都将不胜感激。
许多 Linux 版本都包含 GNU Screen 程序,它允许您在注销后保持进程运行。
连接后,只需运行 screen 命令:
[myhost ~]$ screen
在此屏幕终端内开始您的长期运行过程。
您现在可以关闭终端。关机,重启电脑,什么的。
当您想检查您的进程时,只需重新连接并运行以下命令重新附加:
[myhost ~]$ screen -r
我希望这对你有用。
screen 有很多其他不错的技巧。只需谷歌“Linux Screen”即可获得大量关于此的文章。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句