使用 cusolverDnDpotrfBatched 得到不正确的结果

阿尼克·乔杜里

我想使用 cusolverDnDpotrfBatched 找到 3x3 矩阵的 Cholesky 分解，但我没有得到下三角矩阵中应该存在的零。这是我想要计算 cholesky 分解的矩阵 [1 2 3; 2 5 5; 3 5 12]。应该是这样吗？我错过了什么？我知道这篇文章使用 CUDA 进行 Cholesky 分解。这是我的代码：

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>
#include <cuda_runtime.h>
#include <cusolverDn.h>
#include <iostream>

void printMatrix(int m, int n, const double*A, int lda, const char* name)
{
for(int row = 0 ; row < m ; row++){
    for(int col = 0 ; col < n ; col++){
        double Areg = A[row + col*lda];
        printf("%s(%d,%d) = %f\n", name, row+1, col+1, Areg);
    }
}
}

int main(){
cusolverDnHandle_t handle = NULL;
cusolverDnCreate(&handle);

const cublasFillMode_t uplo = CUBLAS_FILL_MODE_LOWER;
const int batchSize = 1;
//const int nrhs = 1;
const int m = 3;
const int lda = m;
//const int ldb = m;
double A0[lda*m] = { 1.0, 2.0, 3.0, 2.0, 5.0, 5.0, 3.0, 5.0, 12.0 };
int infoArray[batchSize]; /* host copy of error info */

double L0[lda*m]; /* cholesky factor of A0 */

double *Aarray[batchSize];
//double *Barray[batchSize];

double **d_Aarray = NULL;
int *d_infoArray = NULL;
for(int j = 0 ; j < batchSize ; j++){
    cudaMalloc ((void**)&Aarray[j], sizeof(double) * lda * m);
    
}
cudaMalloc ((void**)&d_infoArray, sizeof(int)*batchSize);
//assert(cudaSuccess == cudaStat1);
cudaMalloc ((void**)&d_Aarray, sizeof(double*) * batchSize);
cudaMemcpy(Aarray[0], A0, sizeof(double) * lda * m, cudaMemcpyHostToDevice);
cudaMemcpy(d_Aarray, Aarray, sizeof(double*)*batchSize, cudaMemcpyHostToDevice);
cusolverDnDpotrfBatched( handle,uplo,m,d_Aarray,lda,d_infoArray, batchSize);
cudaDeviceSynchronize();
cudaMemcpy(infoArray, d_infoArray, sizeof(int)*batchSize, cudaMemcpyDeviceToHost);
cudaMemcpy(L0, Aarray[0], sizeof(double) * lda * m, cudaMemcpyDeviceToHost);

for(int i =0; i<9;i++)std::cout<<L0[i]<<std::endl;
//printMatrix(m, m, L0, lda, "L0");
//printf("=====\n");
}

罗伯特·克罗维拉

我没有得到下三角矩阵中应该存在的零。

也许您可能希望阅读文档：

如果输入参数 uplo 是 CUBLAS_FILL_MODE_LOWER，则只处理 A 的下三角部分，并替换为下三角 Cholesky 因子 L。

备注：A 的另一部分用作工作区。例如，如果uplo是CUBLAS_FILL_MODE_UPPER，则A的上三角包含cholesky因子U，并且在potrfBatched之后A的下三角被破坏。

所以没有期望矩阵的另一部分会有零。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-09-8

我来说两句

0 条评论

登录后参与评论

上一篇：遍历 C# 列表以查找多个匹配的字符串并返回索引位置

将IS NOT NULL与COUNT函数一起使用时得到不正确的结果-MySQL

使用 cusolverDnDpotrfBatched 得到不正确的结果

使用 cusolverDnDpotrfBatched 得到不正确的结果

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用