频道导航

当我不知道字节顺序时,如何在Perl中解码UTF-16数据？

2019-07-22 Perl 前端之家

前端之家收集整理的这篇文章主要介绍了当我不知道字节顺序时,如何在Perl中解码UTF-16数据？，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

如果我打开一个文件(并直接指定编码)：

open(my $file,"<:encoding(UTF-16)","some.file") || die "error $!\n";
while(<$file>) {
    print "$_\n";
}
close($file);

我可以很好地阅读文件内容.但是,如果我这样做：

use Encode;

open(my $file,"some.file") || die "error $!\n";
while(<$file>) {
    print decode("UTF-16",$_);
}
close($file);

我收到以下错误：

UTF-16:Unrecognised BOM d at F:/Perl/lib/Encode.pm line 174

如何使其与解码一起使用？

编辑：这是前几个字节：

FF FE 3C 00 68 00 74 00

解决方法

如果您只是指定“UTF-16”,Perl将查找字节顺序标记(BOM)以找出如何解析它.如果没有BOM,它就会爆炸.在这种情况下,您必须通过为little-endian指定“UTF-16LE”或为big-endian指定“UTF-16BE”来告诉Encode您具有哪个字节顺序.

虽然你的情况还有其他的事情发生,但是如果没有看到文件中的数据,很难说清楚.我对两个片段都有同样的错误.如果我没有BOM并且我没有指定字节顺序,我的Perl就会抱怨.您使用的是哪种Perl,您拥有哪个平台？您的平台是否具有文件的本机字节顺序？根据文档,我认为我看到的行为是正确的.

此外,您不能简单地读取某些未知编码的行(无论Perl的默认编码是什么),然后将其发送到解码.您可能最终处于多字节序列的中间.您必须使用Encode :: FB_QUIET来保存无法解码的缓冲区部分,并将其添加到下一个数据块：

open my($lefh),'<:raw','text-utf16.txt';

my $string;
while( $string .= <$lefh> ) {
    print decode("UTF-16LE",$string,Encode::FB_QUIET) 
    }

上一篇：如何在Perl中同时浏览两个文件？下一篇：如何在Perl中重复一次字符串N次？

猜你在找的Perl相关文章

漫谈 Perl 的 web 应用开发框架

忍不住在 PerlChina 邮件列表中盘点了一下 Perl 里的 Web 应用框架（巧的是 PerlBuzz 最近...

作者：前端之家时间：2020-08-13

perl中bless的理解

bless有两个参数：对象的引用、类的名称。类的名称是一个字符串，代表了类的类型信息，这...

作者：前端之家时间：2020-08-13

PERL GB2312 UTF-8 编码转换

gb2312转Utf的方法： use Encode; my $str = "中文"; $str_cnsoftware = encode(&...

作者：前端之家时间：2020-08-13

perl 计算硬盘利用率

perl 计算硬盘利用率，以%来查看硬盘资源是否存在IO消耗cpu资源情况；部份代码参考了...

作者：前端之家时间：2020-08-13

1 简单变量 Perl 的 Hello World 是怎么写的呢？请看下面的程序： #!/usr/bin/perl print ...

作者：前端之家时间：2020-08-13

Perl 中的正则表达式

正则表达式是 Perl 语言的一大特色，也是 Perl 程序中的一点难点，不过如果大家能够很好的...

作者：前端之家时间：2020-08-13

Perl和Shell区别

在学习Perl和Shell时，有很多人可能会问这样一个问题，到底先学习哪个或者学习哪个更好！ ...

作者：前端之家时间：2020-08-13

Perl命令行应用介绍

Perl 有很多命令行参数. 通过它, 我们有机会写出更简单的程序. 在这篇文章里我们来了解...

作者：前端之家时间：2020-08-13

perl的特殊变量

转自： http://bbs.chinaunix.net/thread-1191868-1-1.html# 让你的perl代码看起来更像per...

作者：前端之家时间：2020-08-13

Perl BackConnectShell + Rootlab t00l

2009-02-02 13:07 #!/usr/bin/perl # D.O.M TEAM - 2007 # anonyph; arp; ka0x; xarnuz # ...

作者：前端之家时间：2020-08-13

编程分类

PHP Java Java SE Python C#C&C++Ruby VB asp.Net Go Perl netty Django Delphi Jsp .NET Core Spring Flask Springboot SpringMVC Lua Laravel Mybatis Asp Groovy ThinkPHP Yii swoole

最新文章