前端之家收集整理的这篇文章主要介绍了
正则表达式 – R字符串删除拆分时的标点符号,
前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
假设我有一个字符串,例如以下
内容.
x <- 'The world is at end. What do you think? I am going crazy! These people are too calm.'
我只需要在标点符号上拆分!?并跟随空白并保持标点符号.
这会删除标点符号并在分割部分中留下前导空格
vec <- strsplit(x,'[!?.][:space:]*')
如何分割留下标点符号的句子?
您可以使用perl = TRUE打开
PCRE
并使用lookbehind断言.
strsplit(x,'(?<![^!?.])\\s+',perl=TRUE)
正则表达式:
(?<! look behind to see if there is not:
[^!?.] any character except: '!','?','.'
) end of look-behind
\s+ whitespace (\n,\r,\t,\f,and " ") (1 or more times)
Live Demo
原文链接:https://www.f2er.com/regex/357041.html