频道导航

c# – 如何将已经两次UTF-8编码的字符串解码为简单的UTF-8？

2019-09-28 C# 前端之家

前端之家收集整理的这篇文章主要介绍了c# – 如何将已经两次UTF-8编码的字符串解码为简单的UTF-8？，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

我有一个巨大的 MySQL表,其行以UTF-8编码两次.
例如,“Újratárgyalja”存储为“ÃšjratÃ¡rgyalja”.

MysqL .Net连接器以这种方式下载它们.我尝试了很多与System.Text.Encoding.Convert()的组合,但没有一个工作.

发送集名称’utf8′(或其他字符集)无法解决它.

如何将它们从双UTF-8解码为UTF-8？

解决方法

特殊问题,但我认为我可以通过UTF-8和Latin-1的适当混合来重现它(不仅仅是两次使用UTF-8而没有在Latin-1中插入错误的步骤).这是整个奇怪的往返,“那里又回来了”( Python 2. *或IronPython都应该能够重现这一点)：

# -*- coding: utf-8 -*-
uni = u'Újratárgyalja'
enc1 = uni.encode('utf-8')
enc2 = enc1.decode('latin-1').encode('utf-8')
dec3 = enc2.decode('utf-8')
dec4 = dec3.encode('latin-1').decode('utf-8')

for x in (uni,enc1,enc2,dec3,dec4):
  print repr(x),x

这是有趣的输出……：

u'\xdajrat\xe1rgyalja' Újratárgyalja
'\xc3\x9ajrat\xc3\xa1rgyalja' Újratárgyalja
'\xc3\x83\xc2\x9ajrat\xc3\x83\xc2\xa1rgyalja' ÃjratÃ¡rgyalja
u'\xc3\x9ajrat\xc3\xa1rgyalja' ÃjratÃ¡rgyalja
u'\xdajrat\xe1rgyalja' Újratárgyalja

以Ã开头的奇怪字符串显示为enc2,即两个utf-8编码,其中散布的latin-1解码投入到混合中.正如您所看到的那样,它可以通过完全相反的操作序列来解除：解码为utf-8,重新编码为latin-1,再次重新解码为utf-8 – 原始字符串又回来了(yay ！).

我相信Latin-1(又名ISO-8859-1)和UTF-8的正常往返特性应该保证这个序列能够正常工作(抱歉,没有C#可以立即尝试使用该语言,但我会期望编码/解码序列不应该依赖于使用的特定编程语言.

上一篇：c# – 将IEnumerable转换为字典以获下一篇：c# – StackExchange.Redis异步调用

猜你在找的C#相关文章

C#使用SharpZipLib创建压缩文件，并指定压缩文件夹路径（解决SharpZipLib压缩长路径显示问题）

在项目中使用SharpZipLib压缩文件夹的时候，遇到如果目录较深，则压缩包中的文件夹同样比较...

作者：踏平扶桑时间：2024-09-29

C#使用Parallel处理数据同步写入Datatable并使用BulkInsert批量导入数据库

项目需要，几十万张照片需要计算出每个照片的特征值（调用C++编写的DLL）。业务流...

作者：踏平扶桑时间：2024-09-29

C# byte和10进制、16进制相互转换

var array = new byte[4]; var i = Encoding.UTF8.GetBytes(100.ToString("x2&am...

作者：踏平扶桑时间：2024-09-29

Winform下的Combox根据值来选中项

其实很简单，因为Combox的Item是一个K/V的object，那么就可以把它的items转换成IEnumerabl...

作者：踏平扶桑时间：2024-09-29

HM NIS Edit制作安装包时检测是否有.net4.6环境，没有的时候自动安装。

把.net4.6安装包打包进安装程序。关键脚本如下：头部引用字符串对比库 !include &qu...

作者：踏平扶桑时间：2024-09-29

WPF下使用FreeRedis操作RedisStream实现简单的消息队列

Redis Stream简介 Redis Stream是随着5.0版本发布的一种新的Redis数据类型：高效消费者组...

作者：踏平扶桑时间：2024-09-29

C#进行图片压缩（对jpg压缩效果最好）

直接上代码 1 public static class ImageCompress 2 { 3 /// <summary> 4 /...

作者：踏平扶桑时间：2024-09-29

CefSharp访问需要认证网页或接口(在Request的Headers中添加认证Token)

然后在使用的时候，就可以获取到Header的内容了。

作者：踏平扶桑时间：2024-09-29

C#使用FileSystemWatcher来监控指定文件夹，并使用TCP/IP协议通过Socket发送到另外指定文件夹

项目需求：局域网内有两台电脑，电脑A(Windows系统)主要是负责接收一些文件（远程桌面粘贴...

作者：踏平扶桑时间：2024-09-29

绿色版Mysql自动建立my.ini和命令行启动并动态指定datadir路径

1、先去下载绿色版的Mysql(https://cdn.mysql.com//archives/mysql-5.7/mysql-5.7.20-winx...

作者：踏平扶桑时间：2024-09-29

编程分类

PHP Java Java SE Python C#C&C++Ruby VB asp.Net Go Perl netty Django Delphi Jsp .NET Core Spring Flask Springboot SpringMVC Lua Laravel Mybatis Asp Groovy ThinkPHP Yii swoole

最新文章