将R中的稀疏矩阵的对角线归零的内存有效方法

戴泽尔

我想将R中的稀疏矩阵的对角线清零。我的蛮力方式是将其显式设置为零，但这似乎效率很低。有没有更有效的方法？

require(Matrix)
A <- as(rsparsematrix(nrow = 1e7, ncol = 1e7, nnz = 1e4), "sparseMatrix")
diag(A) <- 0
A <- drop0(A)  # cleaning up

澄清度和分辨率：我最初担心的是Matrix将对角线上的实际零填充为稀疏矩阵。事实并非如此（最后，尽管在此期间，请参见下面的评论）。要看到这一点，请考虑如果将对角线设置为一个会发生什么：

A <- as(rsparsematrix(nrow = 1e7, ncol = 1e7, nnz = 1e4), "sparseMatrix")
format(object.size(A), units = "Mb")

[1]“ 38.3 Mb”

diag(A) <- 1
format(object.size(A), units = "Mb")

[1]“ 152.7 Mb”

我们添加的许多非零元素会耗尽O（n）内存，其中n是矩阵的暗淡。但是，随着diag(A) <- 0我们得到：

diag(A) <- 1
format(object.size(A), units = "Mb")

[1]“ 38.3 Mb”

即，Matrix已经有效地处理了这种情况。

用户名

您可以很快找到非零条目：

ij <- which(A != 0, arr.ind = TRUE)

# Subset to those on the diagonal:

ij <- ij[ij[,1] == ij[,2],,drop = FALSE]

# And set those entries to zero:

A[ij] <- 0

编辑添加：

正如对原始问题的修订所言，这最终并不会节省太多内存，但是速度要快得多。该diag(A) <- 0语句在我的计算机上大约需要3.2秒，而这3个步骤大约需要0.2秒。计时方法如下：

library(microbenchmark)
microbenchmark(A <- as(rsparsematrix(nrow = 1e7, ncol = 1e7, nnz = 1e4), "sparseMatrix"),
{A <- as(rsparsematrix(nrow = 1e7, ncol = 1e7, nnz = 1e4), "sparseMatrix"); diag(A) <- 0},
{A <- as(rsparsematrix(nrow = 1e7, ncol = 1e7, nnz = 1e4), "sparseMatrix");ij <- which(A != 0, arr.ind = TRUE);ij <- ij[ij[,1] == ij[,2],,drop = FALSE];A[ij] <- 0}, times = 10)

当我运行它时，我看到矩阵创建的中间时间为137毫秒，没有别的，创建时间为3351毫秒，加上diag（A）调用，创建时间为319毫秒，其后是我的代码。

它还可以在中间步骤中节省大量内存，这可以使用内存配置文件查看：Rprof(memory=TRUE); run code ; Rprof(NULL); summaryRprof()。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-25

我来说两句

0 条评论

登录后参与评论

将R中的稀疏矩阵的对角线归零的内存有效方法

将R中的稀疏矩阵的对角线归零的内存有效方法

构建类似于Jarvis的本地语言应用程序

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

SQL Server中的非确定性数据类型

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

错误：找不到存根。请确保已调用spring-cloud-contract：convert

如何了解DFT结果

ng升级性能注意事项

Embers js中的更改侦听器上的组合框

Swift 2.1-对单个单元格使用UITableView

Java中的循环开关案例

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

如何使用geoChoroplethChart和dc.js在Mapchart的路径上添加标签或自定义值？

ggplot：对齐多个分面图-所有大小不同的分面

如何避免每次重新编译所有文件？

Swift中的指针替代品？

完全禁用暂停（在内核级别？-必须与使用的DE和登录状态无关！）

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

使用分隔符将成对相邻的数组元素相互连接

如何开始为Ubuntu开发

Blazor：如何将事件传递给通用组件中的onClick函数