至强融核协处理器与至强融核宿主处理器?

阿米尔

主机处理器和协处理器之间有什么区别?特别是至强融核协处理器和至强融核主机处理器?

我在这些机器上有一些性能结果(正在运行扩散方程的并行OpenMP代码),这表明在相同数量的线程正在工作时,主机处理器的工作速度要快得多。我想知道差异并将它们与我的结果联系起来。

鼻子知道所有

只是要重申Jeff在评论中所说的,您有一个Xeon主机和一个附加的Xeon Phi协处理器。当前一代的Xeon Phi(骑士之角)仅可作为协处理器使用,而不能作为独立的Xeon Phi主机(后者应随Knight's Landing一起提供)。

当您在从主机Xeon卸载的情况下运行程序时,可以从此网站上运行多达16个线程。请注意,每个内核的速度约为2.2 GHz。

当您在Xeon Phi协处理器上以本机执行模式运行程序时,应该可以使用更多线程运行。使用的最佳线程数取决于使用的至强融核的型号(某些使用56时效果最佳,其他使用60时效果最佳)。但是请注意,每个至强融核核心(约1.2 GHz)明显比单个至强核(约2.2 GHz)要弱。多核Xeon Phi技术的好处就在于:您可以跨许多核运行。

要考虑的最后一个非常重要的事情是,至强融核拥有512位宽的SIMD指令集。因此,与在主机上相比,您可以支持在至强融核协处理器上运行的更好的SIMD矢量化。就您而言,我相信您的Xeon主机只有一个256位SIMD矢量处理单元。因此,如果您还没有使用SIMD向量化技术,则可以在Xeon Phi上提高性能(如果要处理单精度,则可以提高到x16)。您的Xeon主机最多只能放弃x8性能。刚开始使用Google迷航时,OpenMP 4.0允许您编写类似的东西#pragma omp simd,以告诉编译器何时在整个代码中向量化较低级的循环。如果您确实希望Xeon Phi发挥最高性能,则必须添加SIMD矢量化。

因此,直接回答您的问题:使用相同数量的内核比较Xeon主机和Xeon Phi协处理器之间的性能结果是没有用的。我们已经知道每个Xeon Phi内核都比每个Xeon内核慢。您应该使用每个允许的最大核数(分别为60和16)比较结果,如果要直接比较,请充分利用向量处理单元的优势。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

命令行中的处理器/核数

我可以在至强融核(骑士登陆)处理器上编译Go程序吗?

双核处理器中的每个核有多快?

Intel i7和Xeon四核处理器之间有什么区别?

在带有新硬盘的单核双路至强处理器服务器(32位)上安装12.04的任何指针

四核具有较低的处理器速度,它们还会更好吗?

超线程四核处理器实际上是否具有8个“核”

我们如何知道是否存在英特尔至强融核协处理器

小型办公室数据服务器是否真的需要四核或六核处理器?

我的英特尔主板可以支持2核心四核处理器吗?

当CPU处于单任务模式时,是否同时使用双核处理器中的两个核?

用于n核处理器的Perl fork队列

有至强融核的模拟器吗?

用于宽寄存器(尤其是至强融核)的不带对齐数据访问的矢量化/优化循环

在至强融核中使用tbb原子操作

支持QSV的至强处理器是否默认使用C226芯片组?

至强处理器与常规处理器有何不同?

配备四核处理器的2合1笔记本电脑

安装了至强融核后,主板将无法开机自检

英特尔至强融核卸载代码+ STL向量

未知的至强处理器型号

如何在最近的至强处理器上嵌入式的PCIe 3.0控制器上管理通道?

英特尔®至强®可扩展处理器-它们是否支持“ Flex模式”?

如何逐步加载协处理器

将英特尔的#pragma卸载转换为用于至强融核的OpenMP(性能问题和其他问题)

至强融核和 Ubuntu 服务器

当前一代至强处理器之间的差异

使用 Delphi Threads 的 4 核处理器的效率为 25%

每核线程数 - 处理器