使用mgcv gam在负二项式混合模型中固定效应的意义

鲍勃

我正在使用gammgcv软件包来分析包含24个条目的数据集:

ran  f1     f2   y
1   3000    5   545
1   3000    10  1045
1   10000   5   536
1   10000   10  770
2   3000    5   842
2   3000    10  2042
2   10000   5   615
2   10000   10  1361
3   3000    5   328
3   3000    10  1028
3   10000   5   262
3   10000   10  722
4   3000    5   349
4   3000    10  665
4   10000   5   255
4   10000   10  470
5   3000    5   680
5   3000    10  1510
5   10000   5   499
5   10000   10  1422
6   3000    5   628
6   3000    10  2062
6   10000   5   499
6   10000   10  2158

数据具有两个固定效应(f1f2)和一个随机效应(ran)。相关数据为y因为相关数据y代表计数并且分散过度,所以我使用负二项式模型。

gam模型及其summary输出如下:

library(mgcv)
summary(gam(y ~ f1 * f2 + s(ran, bs = "re"), data = df2, family = nb, method = "REML"))

Family: Negative Binomial(27.376) 
Link function: log 

Formula:
y ~ f1 * f2 + s(ran, bs = "re")

Parametric coefficients:
              Estimate Std. Error z value Pr(>|z|)    
(Intercept)  5.500e+00  3.137e-01  17.533  < 2e-16 ***
f1          -3.421e-05  3.619e-05  -0.945    0.345    
f2           1.760e-01  3.355e-02   5.247 1.55e-07 ***
f1:f2        2.665e-07  4.554e-06   0.059    0.953    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Approximate significance of smooth terms:
         edf Ref.df Chi.sq p-value    
s(ran) 4.726      5  85.66  <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

R-sq.(adj) =  0.866   Deviance explained = 93.6%
-REML = 185.96  Scale est. = 1         n = 24

的Wald检验summary对于f2P = 1.55e-07具有非常高的意义但是,当我f2通过使用方差分析比较两个不同的模型来检验重要性时,我得到了截然不同的结果:

anova(gam(y ~ f1 * f2 + s(ran, bs = "re"), data = df2, family = nb, method = "ML"),
gam(y ~ f1 + s(ran, bs = "re"), data = df2, family = nb, method = "ML"),
test="Chisq")

Analysis of Deviance Table

Model 1: y ~ f1 * f2 + s(ran, bs = "re")
Model 2: y ~ f1 + s(ran, bs = "re")
  Resid. Df Resid. Dev      Df Deviance Pr(>Chi)
1    14.843     18.340                          
2    16.652     21.529 -1.8091   -3.188   0.1752

f2不再重要。根据评估固定效果的建议,将模型从REML更改为ML。

如果保留了相互作用,则使用方差分析仍可以忽略f2的影响:

anova(gam(y ~ f1 + f2 + f1:f2 + s(ran, bs = "re"), data = df2, family = nb, method = "ML"),
gam(y ~ f1 + f1:f2 + s(ran, bs = "re"), data = df2, family = nb, method = "ML"),
test="Chisq")
Analysis of Deviance Table

Model 1: y ~ f1 + f2 + f1:f2 + s(ran, bs = "re")
Model 2: y ~ f1 + f1:f2 + s(ran, bs = "re")
  Resid. Df Resid. Dev       Df Deviance Pr(>Chi)
1    14.843     18.340                           
2    15.645     19.194 -0.80159 -0.85391   0.2855

对于这些方法中哪种更合适的建议,我将不胜感激。非常感谢!

加文·辛普森

的警告部分?anova.gam说:

如果模型a和的b区别仅在于不包含未惩罚成分(例如随机效应),则p的值anova(a,b)不可靠,通常太低。

我猜想p值不可靠,但在这种情况下,您会遇到与预期相反的情况-p值要大得多。

但是,我认为您没有在比较正确的模型。除非您知道自己在做什么,否则在比较具有交互作用的模型时应遵守边际原则。

所以,我比较的主要效应的模型f1,并f2用一个模型,其中包括这些主要作用它们之间的相互作用。

  • 模型1: y ~ f1 * f2 + s(ran, bs = "re")
  • 模型2: y ~ f1 + f2 + s(ran, bs = "re")

除非有什么要讲的,否则您不会告诉我们模型的设置方式,否则,您不应在不包含高阶项中包含的低阶项的情况下包括一个高阶项。例如,你有f1 + f1:f2f2在第二次项被发现,但没有发现在模型中的第一阶项。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

使用具有随机效应的负二项式模型预测的曲线

使用mgcv的GAM对比图

使用mgcv封装的GAM随机效应的方差-协方差矩阵

为什么在“ gam(y〜mgcv :: s ...)”中使用“ mgcv :: s”会导致错误?

mgcv :: gam混合模型中平滑随机项的形式引用

如何使用mgcv :: gam进行插值和“预测”?

mgcv:如何在predict.gam中使用“排除”参数?

使用mgcv :: gam进行非标准评估

使用family = gaulss()时,mgcv GAM中出现错误消息

结合使用嵌套和地图,mgcv gam和扫帚增强

如何在Gamm mgcv模型上使用反向链接功能

mgcv:如何使用Tweedie响应模型进行逐步回归?

从 mgcv 中的分层 GAM 预测固定效应的麻烦

使用Brm在R中使用BRM进行负二项式回归会导致错误

使用mgcv GAM进行二进制逻辑回归时的offset [[i]]错误

尝试使用R中的MASS包运行负二项式回归

使用dnbinom()在负二项式回归中产生的NaN

如何在 sklearn 中对负二项式回归使用 K 折交叉验证?

如何使用logit函数编写JAGS二项式模型文件

提供单个 Excel 公式,用于在 Excel 中使用正或负 N 计算二项式系数 (N,K)

如何使用mgcv软件包从R模型创建R中的ggplot?

使用插入式火车的二项式GLM

在aods3软件包中使用aodmlβ-二项式模型时产生的NaN

使用 ggplot 绘制二项式 GLM

什么时候使用二项式堆?

使用numpy打印二项式系数

在二项式 GLMM 上使用预测函数:生成数值而非二项式值

mgcv访问estimate.gam函数

在ggplot中绘制二项式GLMER的随机效应