在R中,为了从字符串中删除标点符号,我可以这样做:
x <- 'a#,g:?s!*$t/{u}\d\&y' gsub('[[:punct:]]','',x) [1] "agstudy"
这很聪明,但我没有严格控制删除的标点符号(想象一下我想在我的角色中保留一些符号).如何在不忘记任何符号的情况下以更明确的方式重写此gsub,如下所示:
gsub('[#,:?!*$/{}\\&]',x,perl=FALSE)
编辑
我遇到的困难是如何编写正则表达式(我更喜欢在R中)从x中删除所有标点字符,并仅保留#例如:
"a#gstudy"