可以将numpy数组添加到python集吗？

鲍曼

我知道为了将元素添加到集合中，它必须是可哈希的，而numpy数组似乎不是。这引起了一些问题，因为我有以下代码：

fill_set = set()
for i in list_of_np_1D:
    vecs = i + np_2D
    for j in range(N):
        tup = tuple(vecs[j,:])
        fill_set.add(tup)

# list_of_np_1D is a list of 1D numpy arrays
# np_2D is a 2D numpy array
# np_2D could also be converted to a list of 1D arrays if it helped.

我需要使它运行得更快，并且将近50％的运行时间用于将2D numpy数组的切片转换为元组，以便可以将它们添加到集合中。

所以我一直在尝试找出以下

是否有任何方法可以使numpy数组成为函数，或者使像numpy数组（具有矢量加法）这样的功能可哈希化，以便可以将它们添加到集合中？
如果没有，有什么方法可以加快进行元组转换的过程吗？

谢谢你的帮助！

首先创建一些数据：

import numpy as np
np.random.seed(1)
list_of_np_1D = np.random.randint(0, 5, size=(500, 6))
np_2D = np.random.randint(0, 5, size=(20, 6))

运行您的代码：

%%time
fill_set = set()
for i in list_of_np_1D:
    vecs = i + np_2D
    for v in vecs:
        tup = tuple(v)
        fill_set.add(tup)
res1 = np.array(list(fill_set))

输出：

CPU times: user 161 ms, sys: 2 ms, total: 163 ms
Wall time: 167 ms

这是一个加速版本，它使用广播.view()方法将dtype转换为字符串，然后调用set()将字符串转换回array：

%%time
r = list_of_np_1D[:, None, :] + np_2D[None, :, :]
stype = "S%d" % (r.itemsize * np_2D.shape[1])
fill_set2 = set(r.ravel().view(stype).tolist())
res2 = np.zeros(len(fill_set2), dtype=stype)
res2[:] = list(fill_set2)
res2 = res2.view(r.dtype).reshape(-1, np_2D.shape[1])

输出：

CPU times: user 13 ms, sys: 1 ms, total: 14 ms
Wall time: 14.6 ms

要检查结果：

np.all(res1[np.lexsort(res1.T), :] == res2[np.lexsort(res2.T), :])

您也可以使用lexsort()删除重复的数据：

%%time
r = list_of_np_1D[:, None, :] + np_2D[None, :, :]
r = r.reshape(-1, r.shape[-1])

r = r[np.lexsort(r.T)]
idx = np.where(np.all(np.diff(r, axis=0) == 0, axis=1))[0] + 1
res3 = np.delete(r, idx, axis=0)

输出：

CPU times: user 13 ms, sys: 3 ms, total: 16 ms
Wall time: 16.1 ms

要检查结果：

np.all(res1[np.lexsort(res1.T), :] == res3)

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-1

我来说两句

0 条评论

登录后参与评论

上一篇：Windows 10上Visual Studio 2015 Community Edition的修复安装错误

将浮点坐标添加到numpy数组

将元素添加到numpy数组

我可以将课程模板添加到元组吗？

可以将HTTPS功能添加到python flask Web服务器吗？

将单个元素添加到numpy中的数组

可以将地图添加到.ics文件吗？

Python将项目添加到数组

我可以将Crashlytics添加到iOS库吗？

我可以将StretchDirection添加到VisualBrush吗？

将值添加到numpy数组中的部分

可以将QToolbar添加到QDockWidget吗？

可以将数组添加到我的create方法吗？

可以将多个参数添加到excel导入吗？

我可以将环境变量添加到python logger ini文件配置中吗？

python sprite list如何工作？我可以将精灵坐标添加到列表中吗？

这是将元素添加到数组的正确方法吗？

将数组添加到numpy子数组

我可以将样式标签添加到innerHTML吗？

我可以将课程添加到链接中吗

我可以将对象键添加到数组吗？

numpy将列添加到数组数组

我可以将pattern属性添加到textarea吗？

我可以将面孔从数组添加到THREE.BufferGeometry吗？

可以将转换代码添加到pmml吗？

我可以将javascript原型添加到我的数组实例中吗？

我可以将 JLabels 添加到数组中吗？

我们可以将列表作为值添加到 redis 中的排序集吗？

在 Python 中，您可以将列表中的元素添加到字典的值中吗？

TOP 榜单

文章

可以将numpy数组添加到python集吗？

可以将numpy数组添加到python集吗？

Linux的官方Adobe Flash存储库是否已过时？

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

错误：“ javac”未被识别为内部或外部命令，

Modbus Python施耐德PM5300

为什么Object.hashCode（）不遵循Java代码约定

如何正确比较 scala.xml 节点？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

在令牌内联程序集错误之前预期为 ')'

数据表中有多个子行，asp.net核心中来自sql server的数据

VBA 自动化错误：-2147221080 (800401a8)

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

如何在JavaScript中获取数组的第n个元素？

检查嵌套列表中的长度是否相同

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

ES5的代理替代

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

如何监视应用程序而不是单个进程的CPU使用率？

如何检查字符串输入的格式

解决类Koin的实例时出错

如何自动选择正确的键盘布局？-仅具有一个键盘布局