我的数据包含评论(保存在文件中),其中很少有被标记为肯定的。我想使用半监督和PU分类将这些注释分类为肯定和否定类。我想知道在python(scikit-learn)中是否有任何针对半监督和PU实现的公共实现?
您可以尝试训练一类SVM,看看能给您带来什么样的结果。我还没有听说过PU纸。我认为,出于所有实际目的,标记一些点然后使用半监督方法会更好。如果很难找到负点,我将尝试使用启发式方法来找到推定的负点(我认为这与PU论文中的技术类似)。您可以将未标记的与正的分类,然后仅查看那些未标记的得分高的得分,或者学习一类SVM或类似的SVM,然后在异常值中寻找负值。
如果您对实际解决任务感兴趣,那么我宁愿花时间在手动标注上,也不愿执行幻想的方法。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句