假设我有一个如下字符串:
"func(arg1,arg2,arg3,arg4,...,argn)"
编辑:此功能不是某种特定语言.它只是这种格式.如果它更容易,不要把它看作函数调用,只是一个字符串.
我想写一个正则表达式来匹配函数和每个参数.我用Python写这个.所需的输出是:
{"function" : "func","arg" : ["arg1","arg2","argn"]}
编辑:虽然参数可以是函数调用,但是一旦我创建了一个有效的函数,我就可以很容易地递归地尝试将它们与相同的正则表达式匹配.通过这个我的意思是我可以用每个参数递归函数.但这并不是真的相关.我不是想创建一个解释器,只是为了识别这些论点.
以下是我对此的尝试:
import re s = "func(arg1,argn)" m = re.match(r"(?P<function>\w+)\s?\((?P<args>(?P<arg>\w+(,\s?)?)+)\)",s) print m.groupdict()
这是输出:
{'function': 'func','args': 'arg1,argn','arg': 'argn'}
函数匹配得很好,参数集也是如此.但是,我似乎无法匹配个别论点.这是我的正则表达式的问题,还是Python正则表达式匹配的限制?
EDIT2:我知道我现在可以使用以下代码拆分参数:
d["arg"] = d["args"].split(",")
但我想知道我是否能用正则表达式完成整个工作.特别是,我想知道为什么“arg”只匹配最后一个参数.
EDIT3:我想我(1)希望弄清楚为什么Python每次只匹配最后一个参数,以及(2)我是否可以在Python中进行Scheme风格的模式匹配.或者,如果在Python中存在与Scheme样式模式匹配一样直观的东西.我查看了ast模块,它的语法非常复杂.
看起来你有90%,为什么不交换arg和args分组并执行:
import re fn_match = re.match(r"(?P<function>\w+)\s?\((?P<arg>(?P<args>\w+(,s) fn_dict = fn_match.groupdict() del fn_dict['args'] fn_dict['arg'] = [arg.strip() for arg in fn_dict['arg'].split(',')]