如何使大型数据集的聚类热图看起来更好?

小白

我有一个距离矩阵,我对其进行了标准化,使用 python 正则表达式修剪了行和列标题,并尝试使用以下代码从中制作一个聚集热图:

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns


df = pd.read_csv('distance_matrix_Mult_Align(distance).csv', index_col=0)

row_sums = df.sum(axis=1)
new_matrix = df / row_sums[:, np.newaxis]

def acc_id(s):
    import re
    match = re.search('\|(.*)\|', s)    
    if match:
        return match.group(1)

sns.clustermap(new_matrix.rename(columns=acc_id, index=acc_id), 
               row_cluster=False,
               xticklabels=True, 
               yticklabels=True, 
               cmap='RdBu',
               center=0,
               vmin=0, 
               vmax=1)

plt.figure()
plt.show

我的集群地图看起来像这样:在此处输入图片说明我试图阅读 clustermap 和 pyplot 的文档:https : //seaborn.pydata.org/generated/seaborn.clustermap.html https://matplotlib.org/stable/api/_as_gen/ matplotlib.pyplot.figure.html#matplotlib.pyplot.figure但我似乎无法理解如何使情节看起来有用。我真的很感激任何帮助。谢谢!

萨马斯·巴蒂亚

问题出在你的vmax = 1论点上。如果您使用 来查看整个数据集中的最大值new_matrix.max().max(),则大约为 0.17。因此,只需将 vmax 删除为:像这样工作或仅为vmax设置一个较低的值

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何使我的网址看起来更好?

使热图在 R 中看起来更专业

如何在 R 中为大型数据集创建聚类图

如何使我的 VBA 代码看起来更好并减少冗余?

如何使Qt程序在Xfce下看起来更好?

如何使 libreoffice 在 KDE Plasma 中看起来更好?

如何使滚动条看起来更好

如何创建更短的 if 语句,或者让它们看起来更好?

如何使迭代器类看起来不像容器类?

更好(看起来)的Xpages按钮

jQuery使HTML插入看起来更好

在非单调增加的数据集上,散点图看起来不错,但折线图看起来很奇怪

如何采样数据看起来像双变量月亮?

如何切割y轴以使图表看起来更好?

如何使Ubuntu / GNOME看起来更好,例如更小巧紧凑?

如何让 Kubuntu Firefox 中的 feedly 看起来更好,就像 Windows 中的 Firefox 一样?

如何使定位输出看起来像`ll`或`ls -la`但更好呢?

sklearn聚类:确定大型数据集上最佳聚类数的最快方法

更改函数图的粒度以使图看起来平滑

代码看起来很混乱;询问是否有更好的方法

更改Java中的默认按钮,使它们看起来“更好”

在终端Visual Studio Code中看起来更好的输出

如何使UITableView看起来像这样?

如何使uitextfield看起来像在塌陷?

如何使if条件看起来更干净?

如何使CSS渐变看起来平滑?

如何使角色看起来像在移动?

如何查询看起来很团结的字典?

如何使对象“看起来”到对象