我想要一个正则表达式,从文本的开头开始,匹配一个单词.如果输入的确切单词匹配,但也会匹配某些最小数量的匹配字符,前提是任何其他字符也匹配.
例如,如果我正在尝试匹配“旧金山”,但我愿意接受前五个字符足以在域中唯一地标识它:
>比赛:旧金山
>比赛:圣菲
>比赛:圣弗朗西斯科
>比赛:San Franciscoblahblah
>失败:波士顿
>失败:圣地亚哥
>失败:San Fransisko
>失败:圣弗朗索
这几乎可以工作,但错误地匹配最后两个:
^San Fr?a?n?c?i?s?c?o?
我正在使用.NET正则表达式,但任何语言的解决方案都可以.
解决方法
您遇到的问题是分组问题.
^San F(r(a(n(c(i(s(c(o)?)?)?)?)?)?)?)?
括号将使它成为允许’a’取决于前面的’r’,依此类推.它仍然会在’San Frano’和’San Fransisko’上匹配,但比赛只会是’San Fran’,类似于你的’San Fransiscoblahblah’案.