如何将windows-1250 / Cp1250中编码的String转换为utf-8?

前端之家收集整理的这篇文章主要介绍了如何将windows-1250 / Cp1250中编码的String转换为utf-8?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。

正如标题所说……
我从htto响应中读到了内容

 

    InputStream is = response.getEntity().getContent();
    String cw = IoUtils.toString(is);
    byte[] b = cw.getBytes("Cp1250");
    String x = StringUtils.newStringUtf8(b);
    String content = new String(b,"UTF-8");

    System.out.println(content);

 

我尝试了很多变化.我对用作字符串的正确编码常量有点困惑. windows-1250或Cp1250. UTF-8或utf-8还是utf8?

最佳答案
您似乎认为String对象具有编码.那不对.编码用作从二进制数据(byte []或InputStream)到文本数据(String或char []等)的转换的一部分.

目前尚不清楚IoUtils.toString正在做什么,但它几乎肯定会丢失数据或至少不恰当地处理它.如果您的数据最初是在Windows-1250中,那么您应该使用包装InputStream的InputStreamReader,在InputStreamReader构造函数调用中指定charset.

目前尚不清楚UTF-8的用武之地 – 您可能希望之后以UTF-8写出数据,但结果将是byte [],而不是字符串.

猜你在找的Java相关文章