DIY HPC集群以运行Jupyter / Python笔记本

nijshar28

我最近将Python / Jupyter的工作从Macbook迁移到了翻新的Gen 8 HP机架式服务器(192GB DDR3 2 x 8C Xeon E5-2600),我以400美元的价格从亚马逊下车了。额外的CPU内核极大地提高了我拟合模型的速度,尤其是对于我经常使用的决策树集成而言。我现在正在考虑购买那个时代(2010年代中期)的其他服务器(双插槽或四插槽Intel Xeon E5,E7 v1 / v2),并将它们连接为我公寓中的小型HPC集群。这是我需要确定的帮助:

  1. 这是一个坏主意吗?我最好购买GPU(例如gtx 1080)。我不愿意使用GPU的原因是,我倾向于非常依赖sklearn(这几乎是我唯一了解和使用的东西)。而且据我了解,目前在gpus上进行模型训练还不是sklearn生态系统的一部分。我所有的代码都是用numpy / pandas / sklearn编写的。因此,将出现陡峭的学习曲线和向后兼容性问题。我对此有错吗?

  2. 假设(1)是正确的,并且CPU在短期内确实对我来说更好。如何构建集群并在其上运行Jupyter Notebook。是否像购买其他服务器一样简单。将其中一台服务器指定为头节点。通过以太网连接服务器。在两台机器上都安装Centos / Rocks。然后使用IPython Parallel(?)启动Jupyter服务器。

  3. 假设(2)为真,或至少部分为真。我还需要其他什么硬件/软件?我需要一个以太网交换机吗?或者,如果我仅连接两台计算机,则不需要吗?还是我至少需要三台机器来利用额外的CPU内核,因此需要切换?我需要安装Centos / Rocks吗?还是在软件层上有更好,更现代的替代方案。就上下文而言,现在我在HP服务器上使用openSUSE,就操作系统和网络而言,我几乎是一个新手。

  4. 我的硬件应该有多均匀?我可以在机器之间混合并匹配不同频率的CPU和内存吗?例如,在一台计算机上有1600 MHz DDR3内存,而另一台计算机上有1333 MHz DDR3?还是使用2.9 GHz E5-2600v1和2.6 GHz E5-2600v2 CPU?

  5. 我应该担心力量吗?即可以在公寓的同一电源板上安全地插入三台机架式服务器吗?我知道有一个插座可以将吹风机插入电源,然后灯熄灭。因此,我可能应该避免这种情况:)认真地说,如何在负载下运行2-3台多CPU机器,并避免使断路器跳闸?

谢谢。

伊戈尔·里文(Igor Rivin)
  1. Nvidia的rapids.ai工具在GPU上实现了相当多的sklearn。无论那是您使用的部分,只有您可以说。

  2. 使用Jupiter笔记本进行生产是一个错误。

  3. 除非延迟是一个严重的问题,否则不需要切换,这种情况很少发生。

  4. 完全无关。

  5. 对于您正在考虑的那种旧硬件,您将拥有非常高的电费。但更糟糕的是,由于您将拥有许多不是很新的机器,因此某些组件在任何给定时间出现故障的可能性很高,因此除非您寻求计算机维护的未来,否则这不是一个好主意。一个更好的主意是:在Macbook /现有集群上发展您的主意,然后租用AWS竞价型实例(或两个或三个)几天。便宜,没有糊涂,没有大惊小怪。一切正常。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

Jupyter可以在Python笔记本中运行单独的R笔记本吗?

在jupyter笔记本python中密谋

Python Jupyter 笔记本 scipy

如何每天自动运行python jupyter笔记本

无法运行Jupyter笔记本

Anaconda jupyter笔记本

RCPP Jupyter笔记本

Jupyter笔记本-GPU

JupyterLab与Jupyter笔记本

Python 中的缩进错误(在 Jupyter 笔记本中)

jupyter笔记本到python脚本,无格式更改

如何!rm python_var(在Jupyter笔记本中)

在jupyter笔记本中创建原始python文件

使用 python 的 Jupyter 笔记本上下文感知

在Jupyter Python笔记本中清除MatPlotLib图

jupyter笔记本/实验室终端python版本

选择python环境启动spyder或jupyter笔记本

在 Jupyter 笔记本中使用 Python 从 github 导入数据

将变量从Jupyter笔记本传递到python脚本

我可以在集群部署模式下运行pyspark jupyter笔记本吗?

将应用程序提交到从Python笔记本在GCP中运行的独立Spark集群

DIY清洁后笔记本电脑的VGA输出变色/色调

无法从蟒蛇运行jupyter笔记本,但能够从python运行

在IPython笔记本(或IJulia笔记本中的Python代码)中运行Julia代码的最佳方法

我可以从具有python内核的jupyter笔记本中运行具有R内核的jupyter笔记本吗?

如何在Jupyter笔记本中运行Python异步代码?

如何在每个jupyter笔记本内核之前运行Python代码

从jupyter笔记本运行python程序,同时传递文件名作为参数

R foreach使用rpy2 python永远运行jupyter笔记本