在不迭代Python熊猫的情况下计算大型数据框中的模式出现次数

暴风雨1981

我有以下数据框:

    Jack   Joe   Mary
1    I      O     O
2    I      O     I
3    I      I     I
4    O      I     I
5    O      I     O
6    I      O     O
7    I      O     I
8    I      O     I
9    O      I     I
10   O      I     O
      ....

我的专栏各处散布着“ III”和“ OOO”的图案。

我想计算每列中“ III”和“ OOO”的出现次数。

我知道我可以遍历每一列的每一行,但这是一个非常大的数据框。

有没有人有1)执行此操作的更有效方法和2)执行此操作的更Python的方法?

谢谢。

阿米·塔沃里(Ami Tavory)

以“ Jack”列和“ II I”模式为例。

使用移位,我们得到

>>> (df.Jack == df.Jack.shift(1)) & (df.Jack == df.Jack.shift(2)) & (df.Jack == 'I')
1     False
2     False
3      True
4     False
5     False
6     False
7     False
8      True
9     False
10    False
Name: Jack, dtype: bool

所以

((df.Jack == df.Jack.shift(1)) & (df.Jack == df.Jack.shift(2)) & (df.Jack == 'I')).sum() 

给出该模式在列中的出现次数。

您可以轻松地将其修改为其他模式和列。

注意,“ III I”将计为两次出现的模式(交叉)。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何在不迭代每一行的情况下访问熊猫数据框中的值

计算熊猫数据框中某个值的出现次数

计算熊猫数据框中 ID 的出现次数

熊猫:如何在不迭代的情况下使用字典更新匹配的行

熊猫计算成行情况下每月发生的次数

在满足某些条件的情况下(在Python中)循环遍历DataFrame并计算DataFrame中出现次数的最快方法是什么?

在python中给定搜索的情况下,获取结果更快。字典或熊猫数据框的列表?

如何计算列数据框Python中的出现次数

计算 Pandas 数据框中的出现次数

如何在不迭代的情况下将元素插入向量中的多个位置

如何在不迭代数组的情况下从$ scope中删除对象?

如何在不迭代 Thymeleaf 的情况下访问 Map 中的对象键

如何在不迭代数组的情况下提取对象数组中特定键的值?

如何在不迭代的情况下从查询中检查 ActiveRecord 是否存在?

如何在不使用for循环的情况下计算图像中像素强度的出现次数?

计算列表中每个项目在熊猫数据框列中出现的次数,逗号分隔值

如何计算大熊猫数据框中每分钟出现的次数

计算熊猫数据框的两列中每个值组合的出现次数并制作条形图

如何计算大型数据集中的出现次数

在给定某些约束的情况下,如何使用Python浏览目录中的文件并输出熊猫数据框?

如何在不使用分隔符的情况下从CSV创建熊猫数据框(在python中)

如何在不迭代所有元素的情况下找到预排序数组中的元素?

如何在不执行两次SQL调用的情况下计算SQL列中特定值出现的次数

计算每个熊猫列中的数据出现次数

计算熊猫数据帧列中字符的出现次数

在熊猫数据框中按列计数出现的次数

在某些情况下如何重命名熊猫数据框中的列值

如何在不分组的情况下串联熊猫中数据框的所有行

在不使用.apply的情况下对熊猫数据框中的单列执行简单的操作