如何在logit模型中保留或删除预测变量?

Prathap Kb
  1. 假设我的数据集有15个预测变量。如果我想根据变量对模型的重要性/影响力将变量从模型中剔除,则可以使用逻辑回归构建模型。我是否仅在p-值小于0.05时才需要删除预测变量?或者在从glm方程中添加或删除预测变量之前是否需要考虑其他参数?因为有人告诉我,最终我应该建立一个几乎没有预测变量的模型,因为在客户处实施模型很容易。

请在下面的模型摘要中查找并帮助我了解如何根据AIC和p值删除变量。

称呼:

glm(formula = TARGET ~ duration + cons.price.idx + cons.conf.idx + 
    emp.var.rate + poutcome + contact + job, family = binomial(link = "logit"), 
    data = Training)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.9536  -0.3148  -0.1601  -0.1029   3.5807  

系数:

                      Estimate Std. Error z value Pr(>|z|)    
(Intercept)         -1.331e+02  7.048e+00 -18.886  < 2e-16 ***
duration             8.333e-03  1.782e-04  46.764  < 2e-16 ***
cons.price.idx       1.396e+00  7.582e-02  18.408  < 2e-16 ***
cons.conf.idx        6.505e-02  5.673e-03  11.466  < 2e-16 ***
emp.var.rate        -9.507e-01  3.015e-02 -31.538  < 2e-16 ***
poutcomenonexistent  4.426e-01  8.802e-02   5.029 4.94e-07 ***
poutcomesuccess      2.054e+00  1.263e-01  16.267  < 2e-16 ***
contacttelephone    -9.380e-01  8.402e-02 -11.164  < 2e-16 ***
jobblue-collar      -4.662e-01  8.778e-02  -5.311 1.09e-07 ***
jobentrepreneur     -1.287e-01  1.623e-01  -0.793   0.4279    
jobhousemaid        -2.577e-01  2.018e-01  -1.277   0.2015    
jobmanagement       -2.383e-01  1.176e-01  -2.026   0.0428 *  
jobretired           2.729e-01  1.222e-01   2.234   0.0255 *  
jobself-employed    -2.554e-02  1.562e-01  -0.164   0.8701    
jobservices         -2.343e-01  1.086e-01  -2.156   0.0311 *  
jobstudent           3.178e-01  1.486e-01   2.139   0.0324 *  
jobtechnician       -2.138e-02  8.854e-02  -0.241   0.8092    
jobunemployed       -9.136e-02  1.890e-01  -0.483   0.6288  


---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 14499  on 20592  degrees of freedom
Residual deviance:  8568  on 20575  degrees of freedom
AIC: 8604

我的问题是,我什么时候说AIC值好?以及在什么基础上删除变量以保持最少的变量不变。

Fisher计分迭代次数:6

克里斯蒂安·赫希(Christian Hirsch)

您所描述的方法称为逐步逻辑回归,由于其性能较差而受到了很多批评。建议不要使用p值,而应考虑AICSChttp://www2.sas.com/proceedings/sugi26/p222-26.pdf中提供了有关SAS中许多示例的很好的解释

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何从Keras中保存的模型进行预测?

从顶部删除项目时如何在AngularJS中保留ng-repeat的滚动位置

如何使用Orange GUI中保存的RandomForest模型进行预测

如何在两列之间删除重复项,但在各列中保留唯一值?

如何在Cheerp中保留变量名(从C ++到JavaScript的编译器)

如何在LDA中保留已删除文本的文本ID

如何在雄辩的ORM Laravel 5.8中保留“ created_at”的同时删除“ updated_at”

如何在伴侣对象中保留内部变量

在拟合和预测模型之前,如何将logit传递给sigmoid_cross_entropy_with_logits?

如何在变量中保留'/'字符?

C中的静态变量如何在内存中保留?

R:如何在mboost模型中指定预测变量

在R中指定了X变量的Logit预测

如何在su-中保留环境变量?

如何在notepad ++中保留特殊字符串并删除其他字符串?

如何在jersey Web服务中保留类变量的值

JS坐标-> PHP脚本-如何在PHP中保留变量?

使用Spring LocaleChangeInterceptor时如何在URL中保留变量

如何在for循环中保留变量的位数

如何在BASH的FTP命令中保留变量间距?

如何在带有颜色变量的R Plotly条形图中保留所需的顺序

如何在 ArrayList 中保留某些值并删除其余值?

如何正确删除异常值并为线性模型定义预测变量?

如何在文件 Excel 中保留每五行(并删除所有其他行)?

如何在数组中保留特定的键值元素并删除其余元素?

如何将系数设置为特定值,并在模型摘要中保留预测变量?

如何在bash中保留变量的先前值

如何在 SQL 查询中保留一些数字并删除其他数字

2表单提交后如何在php中保留变量