>如果培训实例中缺少值,假设我放置’?’,我是否正确?功能的价值?>假设我能够成功构建决策树,然后从Weka的树结构中用C或Java创建自己的树代码.在分类时,如果我尝试对新实例进行分类,我会为具有缺失值的功能赋予什么价值?如何将树下降到我具有未知值的决策节点?
使用Naive Bayes会更好地处理缺失值吗?我只想为他们分配一个非常小的非零概率,对吗?
以下是佩德罗建议的A缺失值的三种方法:
>在分配给节点n的其他示例中分配A的最常见值>在具有相同目标值的其他示例中分配A的最常见值>将概率p_i分配给A的每个可能值v_i;将示例的分数p_i分配给树中的每个后代.
幻灯片和视频现在可在here查看.