我有这个字符串向量(例如):
str <- c("this is a string current trey","feather rtttt","tusla","laq")
为了计算这个向量中的单词数,我使用了这个(这里给出的是Count the number of words in a string in R?,这可能是重复但有另一个问题)
No_words <- sapply(gregexpr("\\W+",str),length) + 1
但它回来了
6 2 2 2
String在最后两个位置只有1个元素(即“tusla”和“laq”)
所以应该回来
6 2 1 1
我该如何解决这个问题?
你可以试试
sapply(gregexpr("\\S+",x),length) ## [1] 6 2 1 1
或者根据评论中的建议,您可以尝试
sapply(strsplit(x,"\\s+"),length) ## [1] 6 2 1 1