以下是一个快速的Perl问题:
如何转换HTML特殊字符,如& uuml;或'正常的ASCII文本?
我从这样开始:
s/\&#(\d+);/chr($1)/eg;
并且可以为所有HTML字符写入,但是这样的功能可能已经存在了?
请注意,我不需要一个完整的HTML->文本转换器。我已经用HTML :: Parser解析了HTML。我只需要转换文本与我得到的特殊字符。
解决方法
看看
HTML::Entities:
use HTML::Entities; my $html = "Snoopy & Charlie Brown"; print decode_entities($html),"\n";
你可以猜测输出。