Python：使用熊猫将一个数组连接到另一个数组

jack 发表于 Dev

插口

如何使用熊猫得出aoiFeatures和allFeaturesReadings的合并结果，结果如下：

183  0.03
845  0.03
853  0.01

给出以下起始代码和数据：

import numpy
import pandas as pd
allFeatures = [101, 179, 181, 183, 185, 843, 845, 847, 849, 851, 853, 855]
allReadings = [0.03, 0.01, 0.01, 0.03, 0.03, 0.01, 0.03, 0.02, 0.07, 0.06, 0.01, 0.04]
aoiFeatures = [183, 845, 853]

allFeaturesReadings = zip(allFeatures, allReadings)
#
# Use pandas to create Series and Join here?
#
sAllFeaturesReadings = pd.Series(dict(allFeaturesReadings))
sAOIFeatures = pd.Series(numpy.ma.filled(aoiFeatures))
sIndexedAOIFeatures = sAOIFeatures.reindex(numpy.ma.filled(aoiFeatures))
result = pd.concat([sIndexedAOIFeatures,sAllFeaturesReadings], axis=1, join='inner')

算了吧

您可以使用isin：

import pandas as pd
allFeatures = [101, 179, 181, 183, 185, 843, 845, 847, 849, 851, 853, 855]
allReadings = [0.03, 0.01, 0.01, 0.03, 0.03, 0.01, 0.03, 0.02, 0.07, 0.06, 0.01, 0.04]
aoiFeatures = [183, 845, 853]

df = pd.DataFrame({'features':allFeatures, 'readings':allReadings})
result = df.loc[df['features'].isin(aoiFeatures)]
print(result)

产量

    features  readings
3        183      0.03
6        845      0.03
10       853      0.01

如果您计划feature经常根据值选择行，并且features可以将其制成唯一的索引，并且如果DataFrame至少中等大小（例如约10,000行），那么（为提高性能）创建features索引可能会更好：

import pandas as pd
allFeatures = [101, 179, 181, 183, 185, 843, 845, 847, 849, 851, 853, 855]
allReadings = [0.03, 0.01, 0.01, 0.03, 0.03, 0.01, 0.03, 0.02, 0.07, 0.06, 0.01, 0.04]
aoiFeatures = [183, 845, 853]

df = pd.DataFrame({'readings':allReadings}, index=allFeatures)
result = df.loc[aoiFeatures]
print(result)

产量

     readings
183      0.03
845      0.03
853      0.01

这是我用来进行IPython％timeit测试的设置：

import pandas as pd
N = 10000
allFeatures = np.repeat(np.arange(N), 1)
allReadings = np.random.random(N)
aoiFeatures = np.random.choice(allFeatures, N//10, replace=False)

def using_isin():
    df = pd.DataFrame({'features':allFeatures, 'readings':allReadings})
    for i in range(1000):
        result = df.loc[df['features'].isin(aoiFeatures)]
    return result


def using_index():
    df = pd.DataFrame({'readings':allReadings}, index=allFeatures)
    for i in range(1000):
        result = df.loc[aoiFeatures]
    return result

这显示using_index可能会更快一些：

In [108]: %timeit using_isin()
1 loop, best of 3: 697 ms per loop

In [109]: %timeit using_index()
1 loop, best of 3: 432 ms per loop

但是请注意，如果allFeatures包含重复项，则将其作为索引是不利的。例如，如果您将以上设置更改为使用：

allFeatures = np.repeat(np.arange(N//2), 2)    # repeat every value twice

然后

In [114]: %timeit using_isin()
1 loop, best of 3: 667 ms per loop

In [115]: %timeit using_index()
1 loop, best of 3: 3.47 s per loop

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-30

我来说两句

0 条评论

登录后参与评论

上一篇：在今天和今天之间的VBA自动筛选-1年

将一个数组推到另一个数组的末尾

将元素从一个数组移到另一个数组

将一个数组设置为另一个数组

将一个数组映射到另一个数组

将一个数组分组以匹配另一个数组

将一个数组排序为另一个数组-C

如何将一个数组与另一个数组排序

将一个数组与另一个数组值拼接

Ruby：将一个数组“弹出”并推入另一个数组

将一个数组推入另一个数组-嵌套

将一个数组拆分为另一个数组？

将元素从一个数组移到另一个数组

将一个数组合并到另一个数组

将一个数组与另一个数组混洗

如何在 Swift 中将一个可选数组连接到另一个数组？

如何使用PHP将单个数组项推入另一个数组？

检查一个数组是否是另一个数组python的元素

使用for循环和另一个数组填充一个数组

使用另一个数组中的值过滤一个数组

使用implode（）从另一个数组制作一个数组

无论大小如何，将一个数组放入另一个数组中 - Python

使用指针将一个数组分配给另一个数组

使用while循环将一个数组复制到另一个数组

如何使用 splice 和 slice 将一个数组放入另一个数组

使用指针将一个数组的元素复制到另一个数组的函数

一个数组另一个

在 Python 中使用一个数组作为另一个数组的索引

使用python将列替换为另一个数组

将另一个数组作为属性放入另一个数组失败

TOP 榜单

文章

Python：使用熊猫将一个数组连接到另一个数组

Python：使用熊猫将一个数组连接到另一个数组

Linux的官方Adobe Flash存储库是否已过时？

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

错误：“ javac”未被识别为内部或外部命令，

Modbus Python施耐德PM5300

为什么Object.hashCode（）不遵循Java代码约定

如何正确比较 scala.xml 节点？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

在令牌内联程序集错误之前预期为 ')'

数据表中有多个子行，asp.net核心中来自sql server的数据

VBA 自动化错误：-2147221080 (800401a8)

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

如何在JavaScript中获取数组的第n个元素？

检查嵌套列表中的长度是否相同

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

ES5的代理替代

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

如何监视应用程序而不是单个进程的CPU使用率？

如何检查字符串输入的格式

解决类Koin的实例时出错

如何自动选择正确的键盘布局？-仅具有一个键盘布局