如何取两个网络权重的平均值?

patapouf_ai:

假设在PyTorch中,我拥有model1model2拥有相同的架构。他们接受了相同数据的进一步培训,或者一个模型是其他模型的早期版本,但在技术上与该问题无关。现在,我想设置的权重model为平均的权重model1model2我将如何在PyTorch中做到这一点?

小家伙 :
beta = 0.5 #The interpolation parameter    
params1 = model1.named_parameters()
params2 = model2.named_parameters()

dict_params2 = dict(params2)

for name1, param1 in params1:
    if name1 in dict_params2:
        dict_params2[name1].data.copy_(beta*param1.data + (1-beta)*dict_params2[name1].data)

model.load_state_dict(dict_params2)

摘自pytorch论坛您可以获取参数,进行转换并将其加载回去,但要确保尺寸匹配。

我也很想知道您对这些发现的了解。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章