Tag: libsvm

LibSVM将我的所有训练向量转换为支持向量,为什么?

我正在尝试使用SVM进行新闻文章分类。 我创建了一个包含function(在文档中找到的唯一单词)作为行的表。 我用这些特征创建了权重向量映射。 即,如果文章的单词是特征向量表的一部分,则该位置标记为1或0 。 例如: – 培训样本生成… 1:1 2:1 3:1 4:1 5:1 6:1 7:1 8:1 9:1 10:1 11:1 12:1 13:1 14:1 15:1 16:1 17 :1 18:1 19:1 20:1 21:1 22:1 23:1 24:1 25:1 26:1 27:1 28:1 29:1 30:1 由于这是第一份文件,所有function都存在。 我使用0作为类标签。 我使用svm.Net进行分类。 我给出了300手动分类为训练数据的权重向量,生成的模型将所有向量作为支持向量,这肯定是过度拟合的。 我的总要素(特征向量数据库表中的unique words/row count )是7610 。 可能是什么原因? 由于这种过度拟合,我的项目现在状况非常糟糕。 它将每篇文章分类为正面文章。 在LibSVM中,二进制分类是否对类标签有任何限制? 我使用0而不是-1和+1 。 那是问题吗?

SVM可以逐步学习吗?

我正在使用多维SVM分类器(SVM.NET,libSVM的包装器)来分类一组function。 给定SVM模型,是否可以合并新的训练数据而无需重新计算所有先前的数据? 我想另一种方式是:SVM是否可变?