如何使用正则表达式或
Python 3中的任何其他库获取两点之间的字符串?
例如:
Blah blah ABC将要检索的字符串XYZ Blah Blah
ABC和XYZ是表示我必须检索的字符串的开头和结尾的变量.
解决方法
使用ABC和XYZ作为具有后视和前瞻断言的锚点:
(?<=ABC).*?(?=XYZ)
(?< = ...)后视断言仅匹配在ABC之前的文本中的位置.类似地,(?= XYZ)匹配XYZ后面的位置.它们一起构成了两个限制.*表达式的锚点,它与任何东西都匹配. 您可以使用re.findall()找到所有这些锚定的文本片段:
for matchedtext in re.findall(r'(?<=ABC).*?(?=XYZ)',inputtext):
如果ABC和XYZ是可变的,你想在它们上使用re.escape()(以防止它们的任何内容被解释为正则表达式语法)并插入:
re.match(r'(?<={}).*?(?={})'.format(abc,xyz),inputtext)