我有大量文本的文件,我想要做的是删除所有字母数字的单词.
Example of words to be removed: gr8 2006 sdlfj435ljsa 232asa asld213 ladj2343asda asd!32
我能做到这一点的最佳方式是什么?
解决方法
如果要删除由字母和数字组成的所有单词,只留下由所有数字或所有字母组成的单词:
sed 's/\([[:alpha:]]\+[[:digit:]]\+[[:alnum:]]*\|[[:digit:]]\+[[:alpha:]]\+[[:alnum:]]*\) \?//g' inputfile
例:
$echo 'abc def ghi 111 222 ab3 a34 43a a34a 4ab3' | sed 's/\<\([[:alpha:]]\+[[:digit:]]\+[[:alnum:]]*\|[[:digit:]]\+[[:alpha:]]\+[[:alnum:]]*\) \?//g' abc def ghi 111 222