如何将具有二元结果比率的数据集转换为适合R中逻辑回归的值

L Xandor

我有一个数据集,可以汇总查看每组个人

Gender    Age    Region    Count    Affected
Male      18-24    CA      9843     384
Female    18-24    CA      8745     489
Male      35-24    CA      11923    381

等等

我想对受影响的结果进行逻辑回归,该结果本质上是一个二进制响应变量。我可以自己重建数据以使其看起来像

   Gender    Age    Region    Affected
    Male    18-24    CA     0
    Male    18-24    CA     0
(...)
    Male    18-24    CA     1
    Male    18-24    CA     1
(...)
    Female 18-24     CA    0
    Female 18-24     CA    0

依此类推,基本上,为受影响的人创建一个虚拟变量,或者换句话说,为每个组创建一个数据集,为每个受影响的人创建一个行,其中一个为0,每个人为一行。我可以很容易地手动完成此操作,但是R中有一种简单的方法可以将这种二进制比率数据转换为R中的逻辑回归可以使用的数据集

G.格洛腾迪克

试试这个:

glm(cbind(Affected, Count - Affected) ~ Gender + Age, data = DF, family = binomial())

提供以下输出:

Call:  glm(formula = cbind(Affected, Count - Affected) ~ Gender + Age, 
    family = binomial(), data = DF)

Coefficients:
(Intercept)   GenderMale     Age35-24  
    -2.8263      -0.3777      -0.2069  

Degrees of Freedom: 2 Total (i.e. Null);  0 Residual
Null Deviance:      72.39 
Residual Deviance: 7.17e-13     AIC: 29.47

注意:上面我们使用了以下输入:

Lines <- "Gender    Age    Region    Count    Affected
Male      18-24    CA      9843     384
Female    18-24    CA      8745     489
Male      35-24    CA      11923    381"
DF <- read.table(text = Lines, header = TRUE)

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

我如何将R中的单子数据转换为二元数据(将年份转换为配对年份)?

具有多重插补数据的二元逻辑回归

如何对非二元变量执行逻辑回归?

如何使用二元变量构建逻辑回归模型?

如何将列中的值转换为 R 中多元回归的“是”和“否”值

如何将 countvectorizer 应用于 Pandas 数据帧中的二元组

如何在具有逻辑运算符“ <”(小于)的数据框中选择值,将它们除以二,然后将所有值转换为as.numeric

如何将rowmapper中的结果集转换为枚举?

如何将多个结果行转换为具有相应值的单行SQL

如何将-sf数据框列表转换为R中每行具有几何形状的单个数据框?

如何将数据框列表转换为具有新列的数据框在R中显示列表名称

如何将具有空值的JSON数据转换为字典

如何将具有numpy数组值的熊猫系列转换为数据框

熊猫:如何将具有重复索引值的数据框转换为字典

如何将数据框中的值转换为值

如何将茎叶图转换为R中的数据集?

如何将xtabs()的结果转换为R中的数据框?

如何将结果从lapply转换为R中的矩阵?

如何将哈希值转换为适合 SQL 查询的数据类型

sql:如何将行中的值转换为具有前缀和后缀的变量

如何将文件中给定的输入值转换为具有指定格式的数组

从R中的二元数据到二元数据

如何在R中的x和y轴上绘制具有置信区间的二元图?

如何将列表转换为python中具有特定列的数据框?

如何将多行中具有相同键的字典转换为数据框

如何将具有值的第二级类别列转换为多列

如何将一组 xarray 数据集变量转换为具有附加维度的单个变量

如何将此列表转换为R中具有相同名称的数据框?

如何将具有相同字段类型的列表转换为R中的data.frame