参见英文答案 >
Replace commas with pipes,but not the commas enclosed in double quotes 3个
我有一个非常大的文件,我需要用Perl解析.最初编写的文件格式(我无法更改)允许文件在Excel中以CSV格式打开.特别是对于这个问题,我需要用管道(|)替换每一行中的分隔符.通常这不是一项艰苦的工作,但我有一些问题(下面),虽然我确实有一个解决方案,但我想知道是否有更有效的方法来完成我的任务.
我有一个非常大的文件,我需要用Perl解析.最初编写的文件格式(我无法更改)允许文件在Excel中以CSV格式打开.特别是对于这个问题,我需要用管道(|)替换每一行中的分隔符.通常这不是一项艰苦的工作,但我有一些问题(下面),虽然我确实有一个解决方案,但我想知道是否有更有效的方法来完成我的任务.
>数据本身包含带逗号的注释(意味着我无法在逗号中找到并替换)
>每个“单元格”的数据都封装在引号中,但如果单元格为空,则不存在引号
示例行文件:
"Foo Bar","More Foo","More Bar","Yet More","Comma,Separated,Statement"
我目前的解决方案类似于下面的代码.它工作,但它似乎不优雅,需要多次处理每一行(我想避免的事情,因为这个文件非常大).
# Change the delimiter $line =~ s/","/|||||/g; $line =~ s/","/||||/g; $line =~ s/","/|||/g; $line =~ s/","/||/g; $line =~ s/","/|/g; $line =~ s/^"//; # Remove leading quotation mark $line =~ s/"$//; # Remove trailing quotation mark
那里的任何人都可以帮我找到更快更优雅的解决方案吗?
解决方法
使用
Text::CSV_XS.读取每一行,获取每个值,然后使用管道重新加入.让模块为您处理所有格式问题.
请参阅friedo’s answer至Replace commas with pipes,but not the commas enclosed in double quotes中的代码.