我有一个包含多个字符串的txt文件,其中一些用双引号(或三重引号)括起来,想删除引号内的内容并仅保留引号。示例:
""" aaaa """
bbbbb
ccccc
"""
dddddd
"""
,应如下所示:
""" """
bbbbb
ccccc
"""
"""
我必须在python中执行此操作。有人对执行此操作的模块有任何想法吗?
我有一个包含多个字符串的txt文件,其中一些用双引号(或三重引号)括起来,想删除引号内的内容并仅保留引号。示例:
""" aaaa """
bbbbb
ccccc
"""
dddddd
"""
,应如下所示:
""" """
bbbbb
ccccc
"""
"""
我必须在python中执行此操作。有人对执行此操作的模块有任何想法吗?
您可以尝试使用以下正则表达式:
s = '''
""" aaaa """
bbbbb
ccccc
"""
dddddd
"""
'''
import re
print(re.sub(r'(\"{2,3}[\s\n]*).*?([\n\s]*\"{2,3})',r'\1\2',s,flags=re.MULTILINE))
此输出:
""" """
bbbbb
ccccc
"""
"""
编辑:匹配引号正则表达式内的多行应更新。这是示例:
s = '''
""" aaaa """
bbbbb
ccccc
"""
dddddd
bb
"""
'''
import re
print(re.sub(r'(\"{2,3}[\s\n]*)(?:.*?[\s\n]*)*([\n\s]*\"{2,flags=re.MULTILINE))
给出输出:
""" """
bbbbb
ccccc
"""
"""