我有以下正则表达式,我想从句子的开头到第一个##抓住所有内容.我可以使用strsplit来演示这项任务,但我更喜欢使用gsub解决方案.如果gusub不是正确的工具(我认为它是),我更喜欢基础解决方案,因为我想学习基础正则表达式工具.
x <- "gfd gdr tsvfvetrv erv tevgergre ## vev fe ## vgrrgf" strsplit(x,"##")[[c(1,1)]] #works gsub("(.*)(##.*)","\\1",x) #I want to work
只需添加一个字符,放一个?在第一个量词之后使其“非贪婪”:
gsub("(.*?)(##.*)",x) # [1] "gfd gdr tsvfvetrv erv tevgergre "
以下是来自?regex的相关文档
By default repetition is greedy,so the maximal possible number of repeats is used. This can be changed to ‘minimal’ by appending ‘?’ to the quantifier.