Python：如何为所有变量生成频率计数

lydias 发表于 Dev

莉迪亚斯

我有所有分类变量的数据集，我想一次为所有变量产生频率计数。

据说，我使用的是Iris数据集函数，df['class'].value_counts()只允许我计算一个变量。

分析数据集的所有变量仅包括通过Pandas作为csv提取的分类变量。我正在考虑只提取第一行并放入for循环中。为了从csv文件中提取第一行，我们使用将csv转换为dataframe data = pd.DataFrame(data)。但是，data[0]会产生错误。

为所有变量生成频率分析或条形图的最有效方法是什么？

具有分类变量的样本数据集：

   Mary  John   David    Jenny
    a     t       y        n
    a     t       n        y
    a     u       y        y
    a     u       n        y
    a     u       n        n
    b     t       y        n

哈尔潘

方法1

df.apply(lambda x: x.value_counts()).T.stack()

输出：

Mary   a    5.0
       b    1.0
John   t    3.0
       u    3.0
David  n    3.0
       y    3.0
Jenny  n    3.0
       y    3.0
dtype: float64

方法2

df.apply(pd.value_counts).T.fillna(0)

输出量

          a   b   n   t   u   y
Mary    5.0 1.0 0.0 0.0 0.0 0.0
John    0.0 0.0 0.0 3.0 3.0 0.0
David   0.0 0.0 3.0 0.0 0.0 3.0
Jenny   0.0 0.0 3.0 0.0 0.0 3.0

然后，您可以简单地使用以下o创建条形图。

df.apply(pd.value_counts).T.stack().plot(kind='bar')

输出：

或者，您可以使用：

df.apply(pd.value_counts).fillna(0).T.plot(kind='bar')

输出：

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-24

我来说两句

0 条评论

登录后参与评论

上一篇：ASPNET Core OIDC关联失败

如何绘制熊猫柱频率计数？

如何获得按第二个变量分组的单词频率计数（Python）

Python：基于某些行appers的pandas数据框中的两列（变量）获得频率计数

Python Pandas：排除低于特定频率计数的行

Python中的项目频率计数

如何从具有频率计数的值创建数据框列？

如何在python 3中用所有字母（az）创建txt频率计数器

如何获得基于两列的频率计数总和？

SQL频率计数

Mapreduce Job在python中查找单词频率计数

合并具有频率计数的Pandas数据框

计算嵌套字段的所有唯一值的频率计数器

如何根据R中的条件获取日期的频率计数？

如何使用按行的分行符获取频率计数？

如何获取熊猫中的列的频率计数？

如何使用Groupby按时间频率计数-熊猫

第二行变量的频率计数

带有分类变量的频率计数

返回所有或特定列的频率计数的函数

所有可能的料仓的频率计数

Numba在频率计数方面比纯Python慢

如何实现字长频率计数器

Python Pandas Dataframe：用频率计数替换变量

R中多个变量的频率计数

具有多个条件 R 的频率计数

如何为数据框中的所有分类变量制作频率表？

字典中的频率计数——Python 使用理解

MySQL查询以生成多列的频率计数

如何使用lodash从对象数组中创建具有名称和频率计数的对象

TOP 榜单

文章

Python：如何为所有变量生成频率计数

Python：如何为所有变量生成频率计数

Android Studio Kotlin：提取为常量

计算数据帧R中的字符串频率

如何使用Redux-Toolkit重置Redux Store

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

如何使用tweepy流式传输来自指定用户的推文（仅在该用户发布推文时流式传输）

TreeMap中的自定义排序

TYPO3：将 Formhandler 添加到新闻扩展

遍历元素数组以每X秒在浏览器上显示

在Ubuntu和Windows中，触摸板有时会滞后。硬件问题？

警告消息：在matrix（unlist（drop.item），ncol = 10，byrow = TRUE）中：数据长度[16]不是列数的倍数[10]>？

无法连接网络并在Ubuntu 14.04中找到eth0

将辅助轴原点与主要轴对齐

我可以ping IPv6但不能ping IPv4

在Jenkins服务器中使用Selenium和Ruby进行的黄瓜测试失败，但在本地计算机中通过

提交html表单时为空

使用C ++ 11将数组设置为零

如果从DB接收到的值为空，则JMeter JDBC调用将返回该值作为参数名称

尝试在Dell XPS13 9360上安装Windows 7时出错

如何在R中转置数据

无法使用 envoy 访问 .ssh/config

未捕获的SyntaxError：带有Ajax帖子的意外令牌u