使用Numpy查找数组中行的组合，以使每一列的总和为相同的值

ceds 发表于 Dev

塞德斯

我试图用来numpy查找矩阵中行的配置，以便对行的列求和将得到相同的值。例如，对于矩阵/数组

[[0,0,0,1],
 [1,0,1,0],
 [1,1,0,0],
 [0,1,0,0]]

我想将第一行，第二行和最后一行作为输出，因为

  0,0,0,1
  1,0,1,0
  0,1,0,0 +
  -------
= 1,1,1,1

有内置的工具numpy可以帮助我实现这一目标吗？

伊利

一种解决方案是枚举行的幂集，然后检查每个可能的行子集的求和条件。对于具有大量行的矩阵，这可能会非常慢。

使用标准itertools配方进行功率设置：

from itertools import chain, combinations

def powerset(iterable):
    xs = list(iterable)
    return chain.from_iterable(combinations(xs, n) for n in range(len(xs) + 1))

然后我展示了一个包含一些综合数据的工作示例：

In [79]: data
Out[79]: 
array([[0, 1, 1],
       [0, 0, 1],
       [1, 0, 1],
       [0, 1, 1],
       [0, 0, 0],
       [0, 1, 0],
       [1, 1, 1],
       [1, 1, 0],
       [1, 1, 1],
       [0, 1, 0]], dtype=int32)

In [80]: def is_constant(array):
    ...:     return (array == array[0]).all()
    ...: 

In [81]: solution = []

In [82]: for candidate in powerset(range(len(data))):
    ...:     if candidate and is_constant(data[candidate, :].sum(axis=0)):
    ...:         solution.append(candidate)
    ...:

例如，其中显示：

In [83]: solution
Out[83]: 
[(4,),
 (6,),
 (8,),
 (1, 7),
 (2, 5),
 (2, 9),
 (4, 6),
 (4, 8),
 (6, 8),
 (0, 2, 7),
 (1, 4, 7),
 (1, 6, 7),
 (1, 7, 8),
 (2, 3, 7),
 (2, 4, 5),
 (2, 4, 9),
 (2, 5, 6),
 (2, 5, 8),
 (2, 6, 9),
 (2, 8, 9),
 (4, 6, 8),
 (0, 2, 4, 7),
 (0, 2, 6, 7),
 (0, 2, 7, 8),
 (1, 2, 5, 7),
 (1, 2, 7, 9),
 (1, 4, 6, 7),
 (1, 4, 7, 8),
 (1, 6, 7, 8),
 (2, 3, 4, 7),
 (2, 3, 6, 7),
 (2, 3, 7, 8),
 (2, 4, 5, 6),
 (2, 4, 5, 8),
 (2, 4, 6, 9),
 (2, 4, 8, 9),
 (2, 5, 6, 8),
 (2, 6, 8, 9),
 (0, 2, 4, 6, 7),
 (0, 2, 4, 7, 8),
 (0, 2, 6, 7, 8),
 (1, 2, 4, 5, 7),
 (1, 2, 4, 7, 9),
 (1, 2, 5, 6, 7),
 (1, 2, 5, 7, 8),
 (1, 2, 6, 7, 9),
 (1, 2, 7, 8, 9),
 (1, 4, 6, 7, 8),
 (2, 3, 4, 6, 7),
 (2, 3, 4, 7, 8),
 (2, 3, 6, 7, 8),
 (2, 4, 5, 6, 8),
 (2, 4, 6, 8, 9),
 (0, 2, 4, 6, 7, 8),
 (1, 2, 4, 5, 6, 7),
 (1, 2, 4, 5, 7, 8),
 (1, 2, 4, 6, 7, 9),
 (1, 2, 4, 7, 8, 9),
 (1, 2, 5, 6, 7, 8),
 (1, 2, 6, 7, 8, 9),
 (2, 3, 4, 6, 7, 8),
 (1, 2, 4, 5, 6, 7, 8),
 (1, 2, 4, 6, 7, 8, 9)]

我们可以针对以下几种情况验证解决方案：

In [84]: data[(1, 2, 4, 6, 7, 8, 9), :].sum(axis=0)
Out[84]: array([4, 4, 4])

In [85]: data[(0, 2, 4, 6, 7), :].sum(axis=0)
Out[85]: array([3, 3, 3])

为了将其扩展到更特定的用例，您可以itertools.combinations用来生成仅具有特定大小的子集，例如恰好2行或恰好3行等。

或者，您可以从示例中给出的结果集中过滤掉不需要的结果（例如一次由一行组成的琐碎解决方案）。

请注意，您可以简化函数的定义powerset（我使用的实际上是取自有关itertools配方的Python文档）。您可以传递整数并直接跳过以返回最终chain.from_iterable结果，而不是传递可转换为列表的可迭代对象，然后将其修改为仅len(data)作为powerset我示例中的参数传递，如下所示：

from itertools import chain, combinations

def powerset(N):
    """Power set of integers {0, ..., N-1}."""
    xs = list(range(N))
    return chain.from_iterable(combinations(xs, n) for n in range(N + 1))

...
for candidate in powerset(len(data)):
    ...

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。