所以我对正则表达式非常好,但是我在unix上遇到了一些问题.以下是我想知道如何做的两件事:
1)替换除字母,数字和下划线之外的所有文本
preg_replace('#[^a-zA-Z0-9_]#','',$text).
在bash中我试过这个(成效有限);好像它不允许你使用全套正则表达式:
text="my #1 example!" ${text/[^a-zA-Z0-9_]/'')
我用sed尝试了它,但它似乎仍然有完整的正则表达集的问题:
echo "my #1 example!" | sed s/[^a-zA-Z0-9\_]//
我确定有一种方法可以用grep来做,但是当我尝试时它将它分成多行:
echo abc\!\@\#\$\%\^\&\*\(222 | grep -Eos '[a-zA-Z0-9\_]+'
最后我也尝试使用expr,但似乎对扩展正则表达式的支持非常有限……
2)捕获(多个)文本部分
在PHP中我可以做这样的事情:
preg_match('#(word1).*(word2)#',$text,$matches);
我不确定在* nix中怎么可能……
最佳答案
第1部分
你几乎就在那里,sed只需添加g修饰符,以便替换发生在全球,没有g,替换只会发生一次.
$echo "my #1 example!" | sed s/[^a-zA-Z0-9\_]//g
my1example
$
您的bash模式替换也犯了同样的错误:不全局替换:
$text="my #1 example!"
# non-global replacement. Only the space is delete.
$echo ${text/[^a-zA-Z0-9_]/''}
my#1 example!
# global replacement by adding an additional /
$echo ${text//[^a-zA-Z0-9_]/''}
my1example
第2部分
捕获在sed中的工作方式与在PHP的正则表达式中相同:将模式括在括号中捕获:
# swap foo and bar's number using capturing and back reference.
$echo 'foo1 bar2' | sed -r 's/foo([0-9]+) bar([0-9]+)/foo\2 bar\1/'
foo2 bar1
$