我有一组嵌套元组:
('id',('name',('name_float_fml',)),('user',('email',('last_login',)))
我想将列表与类似的前缀组合在一起,从而产生:
('id','last_login')))
这是另一个例子:
(('baz',('bing',('fizz','frozz',('frazz',('fry','bleep','blop'))))),('baz',('zap',('zang',))),'foo','bar')
将被合并为:
(('baz',(('bing','blop')))),('zang')))),'bar')
这些用于存储从根到树叶的路径:
>’baz’ – > ‘bing’ – > ‘fizz’,又名. (‘baz'(‘bing'(‘fizz,)))
>’baz’ – > ‘zap’ – > ‘zang’,aka(‘baz'(‘zap’,(‘zang’,)))
>’baz’ – > ‘bing’ – > ‘frazz’ – > ‘blop’,aka(‘baz’,(‘bing’,(‘frazz’,(‘blop,))))
我想合并通过相同路径到达叶子的元素.我希望这提供了一些澄清.
我写了一些代码来做这件事,但它很难看,冗长,而且可能很脆弱.是否有一些通用,简洁和/或有效的方法来做到这一点?我想可能会有一些我不知道的itertools魔法会提供一些优雅的解决方案.
注意:我正在使用python 2.4
最佳答案
这是适用于您发布的示例的版本:
a = ('id',)))
b = (('baz','bar')
def preserve_path(value):
if len(value) == 2 and isinstance(value[1],(list,tuple)):
return [value]
else:
return value
def flatten_group(my_list):
d = {}
for item in my_list:
# Only items with one string,followed by one tuple represent a path
# segment. In all other situations,strings are leaves.
if isinstance(item,tuple)) and len(item) == 2:
key,value = item
if key in d:
d[key].extend(flatten_group(preserve_path(value)))
else:
d[key] = preserve_path(list(flatten_group(value)))
else:
yield item
for item in d.iteritems():
yield item
print list(flatten_group(a))
# ['id',['name_float_fml']),['email','last_login'])]
print list(flatten_group(b))
# ['foo','bar',[['bing','blop')))],['zang'])])]
编辑3:更新了适用于这两个示例的共同版本,并且包含了您的限制,即它只需要考虑合并作为元组/列表的项目并包含两个项目.这也可以防止合并项目的额外扁平化.