对具有多个条件的嵌套哈希进行排序

Fernando Delgado Chaves占位符图像

我是perl编程的新手，我得到了一个哈希，可以这样编写：

$hash{"snake"}{ACB2}   = [70, 120];
$hash{"snake"}{SGJK}   = [183, 120];
$hash{"snake"}{KDMFS}   = [1213, 120];
$hash{"snake"}{VCS2}   = [21, 120];
...
$hash{"bear"}{ACB2}   = [12, 87];
$hash{"bear"}{GASF}   = [131, 87];
$hash{"bear"}{SDVS}   = [53, 87];
...
$hash{"monkey"}{ACB2}   = [70, 230];
$hash{"monkey"}{GMSD}   = [234, 230];
$hash{"monkey"}{GJAS}   = [521, 230];
$hash{"monkey"}{ASDA}   = [134, 230];
$hash{"monkey"}{ASMD}   = [700, 230];

哈希的结构总结如下：

%hash{Organism}{ProteinID}=(protein_length, total_of_proteins_in_that_organism)

我想根据某些条件对该哈希进行排序。首先，我只想考虑蛋白质总数大于100的那些生物，然后我要显示该生物的名称以及最大的蛋白质及其长度。

为此，我将采用以下方法：

    foreach my $org (sort keys %hash) {
        foreach my $prot (keys %{ $hash{$org} }) {
            if ($hash{$org}{$prot}[1] > 100) {
                @sortedarray = sort {$hash{$b}[0]<=>$hash{$a}[0]} keys %hash;

                print $org."\n";
                print @sortedarray[-1]."\n";
                print $hash{$org}{$sortedarray[-1]}[0]."\n"; 
            }
        }
    }

但是，这打印的生物体名称是蛋白质总数的许多倍，例如，它打印“蛇” 120次。此外，这排序不正确，因为我想我应该在排序行中使用变量$ org和$ prot。

最后，输出应如下所示：

snake
"Largest protein": KDMFS [1213]

monkey
"Largest protein": ASMD [700]

出租

所有数据以打印方式排序

use warnings;
use strict;
use feature 'say';

use List::Util qw(max);

my %hash;   
$hash{"snake"}{ACB2}   = [70, 120];
$hash{"snake"}{SGJK}   = [183, 120];
$hash{"snake"}{KDMFS}   = [1213, 120];
$hash{"snake"}{VCS2}   = [21, 120];
$hash{"bear"}{ACB2}   = [12, 87];
$hash{"bear"}{GASF}   = [131, 87];
$hash{"bear"}{SDVS}   = [53, 87];    
$hash{"monkey"}{ACB2}   = [70, 230];
$hash{"monkey"}{GMSD}   = [234, 230];
$hash{"monkey"}{GJAS}   = [521, 230];
$hash{"monkey"}{ASDA}   = [134, 230];
$hash{"monkey"}{ASMD}   = [700, 230];

my @top_level_keys_sorted = 
    sort {   
        ( max map { $hash{$b}{$_}->[0] } keys %{$hash{$b}} ) <=> 
        ( max map { $hash{$a}{$_}->[0] } keys %{$hash{$a}} )
    }   
    keys %hash;

for my $k (@top_level_keys_sorted) {
    say $k; 
    say "\t$_ --> @{$hash{$k}{$_}}" for 
        sort { $hash{$k}{$b}->[0] <=> $hash{$k}{$a}->[0] } 
        keys %{$hash{$k}};
}

首先，根据要求，按arrayref值中的第一个数字对顶级键进行排序。有了排序的键列表，我们接下来进入每个键的hashref并进一步排序。该循环是我们根据需要调整输出的限制（总数前100个，长度最大等）。

它打印

蛇
        KDMFS - > 1213 120 
        SGJK - > 183 120 
        ACB2 - > 70 120 
        VCS2 - > 21 120
猴
        ASMD - > 700个230 
        GJAS - > 521 230 
        GMSD - > 234 230 
        ASDA - > 134 230 
        ACB2 - > 70 230
熊
        GASF - > 131个87 
        SDVS - > 53 87 
        ACB2 - > 12 87

我不能说输出的结果应该显示所有“蛋白质总数大于100的生物体”（文本）还是仅显示最大的一个（所需输出），所以我将其全部保留。根据需要切断。要仅获取最大的一个，请比较循环中每个键的最大值，或参阅此帖子（相同的问题）。

请注意，哈希本身无法进行“排序”，因为它本质上是无序的。但是我们可以像上面那样打印出已排序的内容，或者根据需要生成可以排序的辅助数据结构。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-21

我来说两句

0 条评论

登录后参与评论

上一篇：如何迅速将核心数据管理对象数组转换为“可识别”列表？（Xcode 11，Beta 5）

TOP 榜单

文章

对具有多个条件的嵌套哈希进行排序

对具有多个条件的嵌套哈希进行排序

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用