我的一段代码,用于删除short&某些文字中的长词是:
# Remove Words based on lowerCutOff & upperCutOff removeByLength<- function(text,lowerCutOff=2,upperCutOff=12){ text<- gsub("\\b[a-zA-Z0-9]{1,lowerCutOff}\\b|\\b[a-zA-Z0-9]{upperCutOff,}\\b"," ",text) return(text) }
如何在不对较低和较低的硬盘进行硬编码的情况下实现所需的功能.上截止点?
解决方法
使用paste来连接字符串以创建模式:
removeByLength<- function(text,upperCutOff=12){ pattern <- paste("\\b[a-zA-Z0-9]{1,",lowerCutOff,"}\\b|\\b[a-zA-Z0-9]{",upperCutOff,sep="") text <- gsub(pattern,text) return(text) }