代码在循环中的某处变得混乱!请帮我解决。
使用参考元素复制和/或重新分配多维数组中的大多数数组元素。
File-1:数组索引列表以及需要在原始数组中维护的元素。
文件2:需要使用上述信息重写的原始多维数组。除上述元素外,所有其他元素都必须重新分配。
文件3:预期输出(重新分配的数组元素)
注意:除了file1的数组索引外,所有索引的其余部分都将替换为参考行。参考线通常出现在数组的第一行中。
在修改后的数组中,不需要参考线。
文件1:
ID1 2 E1,E4
ID2 5 E6,E7,E9
ID3 1 E3
文件2:
ID1.txt
Ref K L M N O P A B C D
E1 S H G U S K R E K K
E2 S L G N O P A B C D
E3 S L G N O P A B C D
E4 U L G G O P A B C D
E5 U L M G O P A J C D
E6 U L M G O P A J C D
E7 U L M G O P A J C D
E8 U L M G O P A J C D
E9 S L M N O P A J C D
E10 S L M N O P A J C D
.
.
.
文件3:预期输出
new_ID1.txt
E1 K L G N O P A B C D
E2 K L M N O P A B C D
E3 K L M N O P A B C D
E4 K L G N O P A B C D
E5 K L M N O P A B C D
E6 K L M N O P A B C D
E7 K L M N O P A B C D
E8 K L M N O P A B C D
E9 K L M N O P A B C D
E10 K L M N O P A B C D
.
.
.
在预期的输出(new_ID1.txt)中,从原始数组维护“ E1”和“ E4”的数组的第二个索引。其他所有内容均由“ E2,E3,E5 ...”中的参考行替换。
#!/usr/bin/perl
use strict;
use warnings;
my %HoHoA = ();
open(IN,"ids.txt");
my @ids = <IN>; chomp @ids; close IN;
open(IN2,"indices_and_values.txt");
while(my $l = <IN2>)
{
chomp $l;
my @tmp = split "\t", $l;
my $lid = $tmp[0];
my $pos = $tmp[1];
my @gps = @tmp[2..$#tmp];
foreach my $g (@gps)
{
push @{$HoHoA{$lid}{$g}}, $pos;
}
}
close IN2;
foreach my $outer (sort keys %HoHoA)
{
open(IN3,"$outer.txt");
my @rS = <IN3>; chomp @rS; close IN3;
my @orgArr = (); my @refArr = (); my @newArr = ();
foreach my $unk (@rS)
{
@orgArr = split "\t", $unk;
if($unk =~ /^Ref/)
{
@refArr = split "\t", $unk;
next;
}
foreach my $inner (sort keys %{$HoHoA{$outer}})
{
if($inner =~ /^$orgArr[0]/)
{
foreach my $ele (sort {$a <=> $b} @{$HoHoA{$outer}{$inner}})
{
$refArr[$ele] = $orgArr[$ele];
}
}
#else
#{
#}
}
print ">$orgArr[0]\t";
print join("\t",@refArr[1..$#refArr]);
print "\n";
}
@rS = ();
print "\n";
}
所示代码很完美,但是有点太复杂了。您可能对嵌套数据结构的操作迷失了方向。这是另一种更简单的方法。
将来自“参考”文件(File-1
)的信息解析为哈希(E1 => [2, ...], ..)
。我将数据索引放置在arrayref中,以允许一行有多个索引。然后一行一行地进行操作,用这些索引替换具有键的行中的数据,并在输出时打印输出。
use warnings;
use strict;
use feature 'say';
my ($ref_file, $data_file) = @ARGV;
die "Usage: $0 ref-file data-file\n" if not $ref_file or not $data_file;
open my $fh, '<', $ref_file or die "Can't open $ref_file: $!";
my %rows;
while (<$fh>) {
my (undef, $idx, $row_id) = split;
for (split /,/, $row_id) {
push @{$rows{$_}}, $idx; # elem => [ indices ]
}
}
my $outfile = 'new_' . $data_file;
open $fh, '<', $data_file or die "Can't open $data_file: $!";
open my $fh_out, '>', $outfile or die "Can't open $outfile: $!";
my @ref = split ' ', <$fh>;
shift @ref; # toss the first field
while (<$fh>) {
my ($row_id, @data) = split;
if (exists $rows{$row_id}) { # this row needs attention
my @new_row = @ref;
foreach my $idx (@{$rows{$row_id}}) { # keep data at these indices
$new_row[$idx] = $data[$idx];
}
say $fh_out join "\t", $row_id, @new_row;
}
else { # use whole reference line
say $fh_out join "\t", $row_id, @ref;
}
}
新文件(为了便于阅读,显示了两个空格而不是实际的选项卡)
E1 KLGNOPABCD E2 KLMNOPABCD E3 KLMNOPABCD E4 KLGNOPABCD E5 KLMNOPABCD E6 KLMNOPABCD E7 KLMNOPABCD E8 KLMNOPABCD E9 KLMNOPABCD E10 KLMNOPABCD
请注意,给定的输入文件恰好具有与参考线相同的条目,以便在许多感兴趣的索引处进行替换-因此我们在上面的输出中看不到那些“更改”。(我通过更改输入文件进行了测试,以便能够看到。)
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句