说我有一个具有两个或更多列的数据帧df,有没有一种简单的方法来使用unique()或其他R函数创建两个或更多列的唯一组合的子集?
我知道我可以使用sqldf()并写一个简单的“SELECT DISTINCT var1,var2,… varN”查询,但是我正在寻找一种这样做的R方式.
在我看来,尝试将ftable强制转换为数据框并使用字段名称,但是我也得到了数据集中不存在的组合的交叉表:
uniques <-
as.data.frame(ftable(df$var1,
df$var2))
解决方法
唯一的工作在data.frame如此独特(df [c(“var1”,“var2”)])应该是你想要的.
另一个选择与dplyr
package不同
df %>% select(var1,var2) %>% distinct
(或旧的方式不同(select(df,var1,var2))).