特征值：有效地将矩阵求值的输出存储在原始指针中

不来梅

我正在使用一些传承许多原始指针的旧式C代码。要与代码交互，我必须传递以下形式的函数：

const int N = ...;

T * func(T * x)  {
    // TODO Put N elements in x
    return x + N;
}

该函数应将结果写入的位置x，然后返回x。

在内部，在此功能中，我广泛使用Eigen进行一些计算。然后，使用Map该类将结果写回到原始指针。一个模仿我在做什么的简单例子是这样的：

const int N = 5;
T * func(T * x)  {

    // Do a lot of operations that result in some matrices like
    Eigen::Matrix<T, N, 1 > A = ... 
    Eigen::Matrix<T, N, 1 > B = ... 

    Eigen::Map<Eigen::Matrix<T, N, 1 >> constraint(x);
    constraint = A - B;

    return x + N;
}

显然，内部发生了很多复杂的事情，但这就是要点...用Eigen进行一些计算，然后使用Map该类将结果写回到原始指针。

现在的问题是，当我使用Callgrind分析此代码，然后使用KCachegrind查看结果时，这些行

constraint = A - B;

几乎总是瓶颈。这是可以理解的，因为此类行可能/正在做三件事：

构造Map对象
执行计算
将结果写入指针

因此可以理解，这条线的运行时间最长。但是我有点担心，也许我在以某种方式在将数据写入原始指针之前在那一行进行了额外的复制。

那么，是否有更好的方法将结果写入原始指针？还是我应该使用的成语？

在我的脑海中，我想知道使用placement new语法是否可以在这里给我带来任何好处。

注意：此代码是关键任务，应实时运行，因此我确实需要从中挤出每一分的速度。例如，从0.12秒到0.1秒的运行时间获得此调用对我们来说将是巨大的。但是，由于我们一直在调整内部计算中使用的模型，因此代码易读性也是一个巨大的问题。

加格尔

这两行代码：

Eigen::Map<Eigen::Matrix<T, N, 1 >> constraint(x);
constraint = A - B;

本质上由Eigen编译为：

for(int i=0; i<N; ++i)
  x[i] = A[i] - B[i];

由于显式展开和显式矢量化（均取决于T），因此实际情况更加复杂，但这实际上就是事实。因此，该Map对象的构造本质上是无操作的（任何编译器都对其进行了优化），并且没有，这里没有多余的副本。

实际上，如果您的探查器能够告诉您瓶颈在于此简单表达式上，则很可能意味着该代码段尚未内联，这意味着您未启用编译器优化标志（例如-O3gcc / clang）。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-29

我来说两句

0 条评论

登录后参与评论

上一篇：自动构建后，“存储桶中的文件”会释放“公开共享”权限

快速有效地计算已知特征值的特征向量

如何最有效地存储矩阵的值

如何有效地将三角矩阵存储在内存中？

执行：将十六进制值有效地存储在内存中

如何更有效地存储距离矩阵？

有效地在双向链接列表中搜索具有指针约束的值？

有效地从矩阵中逐列减去

有效地比较R中的矩阵

如何使用R中的列表条目有效地设置矩阵的值？

有效地将图片存储在 Firebase 存储中？

有效地变换矩阵

如何有效地更新特征稀疏矩阵项

有效地更新特征中大型稀疏矩阵的某些块？

有效地将模式存储在文件中的向量中

使用df.loc将列表有效地存储到熊猫中

如何安全有效地将SSN存储在数据库中？

如何有效地将项目分组到成对的存储桶中（如果存在）

如何有效地将图片存储在数据库中？

有效地将压缩值写入流

将大的稀疏矩阵存储在内存中以计算特征值

有效地在词典列表中查找值

如何有效地将CSS值导入到javascript文件中？

如何在python中有效地将字典中的值分组

如何根据条件有效地将函数应用于数组中的值？

如何有效地将 JavaScript 对象的值隔离到 Array 中？

如何有效地将位位置提取为C中的值

如何使用Pandas将值有效地合并到重叠的bin中？

有效地将范围列表映射到文件中的值列表

如何有效地从矩阵的每个重复行中获取最小值和最大值

TOP 榜单

文章

特征值：有效地将矩阵求值的输出存储在原始指针中

特征值：有效地将矩阵求值的输出存储在原始指针中

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用