正则表达式 – 如何计算文本中的单词数(字符串)?

前端之家收集整理的这篇文章主要介绍了正则表达式 – 如何计算文本中的单词数(字符串)?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我有这个字符串向量(例如):
str <- c("this is a string current trey","feather rtttt","tusla","laq")

为了计算这个向量中的单词数,我使用了这个(这里给出的是Count the number of words in a string in R?,这可能是重复但有另一个问题)

No_words <- sapply(gregexpr("\\W+",str),length) + 1

但它回来了

6 2 2 2

String在最后两个位置只有1个元素(即“tusla”和“laq”)

所以应该回来

6 2 1 1

我该如何解决这个问题?

你可以试试
sapply(gregexpr("\\S+",x),length)
## [1] 6 2 1 1

或者根据评论中的建议,您可以尝试

sapply(strsplit(x,"\\s+"),length)
## [1] 6 2 1 1

猜你在找的正则表达式相关文章