weka中的一元类文本分类?

前端之家收集整理的这篇文章主要介绍了weka中的一元类文本分类?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我有一个针对特定类别的训练数据集(文本)(比如癌症).我想在weka中为这个类训练一个SVM分类器.但是,当我尝试通过创建一个文件夹’癌症’并将所有这些培训文件放到该文件夹​​时,当我运行代码时,我得到以下错误
weka.classifiers.functions.SMO:无法处理一元类!

我想要做的是,如果分类器找到一个与“癌症”相关的文档,它会正确地说出类名,一旦我输入了非癌症文件,就应该说“未知”.

我该怎么做才能得到这种行为?

解决方法

Weka中的SMO算法仅在两个类之间进行二进制分类. Sequential Minimal Optimization是一种用于求解SVM的特定算法,在Weka中这是该算法的基本实现.如果你有一些癌症的例子和一些不是癌症的例子,那么这将是二元的,也许你没有正确地标记它们.

但是,如果您使用的训练数据都是癌症的例子,并且您希望它告诉您未来的示例是否符合该模式,那么您正在尝试进行一类SVM,即异常值检测.

LibSVM in Weka可以处理一流的svm.与Weka SMO实现不同,LibSVM是一个独立的程序,它已经与Weka连接并包含许多不同的SVM变体. Wekalist上的This post解释了如何在Weka中使用LibSVM.

猜你在找的HTML相关文章