正则表达式 – 我想在R中使用gsub来匹配所有不是字母数字的项目

前端之家收集整理的这篇文章主要介绍了正则表达式 – 我想在R中使用gsub来匹配所有不是字母数字的项目前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我正在使用R搜索原始的Twitter片段,但仍然遇到有非标准字母数字字符的问题,例如以下“̆ºÌøÑ”.

我想用gsub取出所有非[abcdefghijklmnopqrstuvwxyz0123456789]字符.

您是否可以使用gsub指定不在[abcdefghijklmnopqrstuvwxyz0123456789]中的那些项目的替换?

解决方法

你可以用[^ …]简单地否定你的模式:

x <- "abcde🏄fgh"
gsub("[^A-Za-z0-9]","",x)
# [1] "abcdefgh"

请注意,班级[:alnum:]匹配您给定的所有特殊字符.这就是为什么gsub(“[^ [:alnum:]]”,“”,x)不起作用的原因.

猜你在找的正则表达式相关文章