经常上网的人有时候会发现出来的网页,上面的字居然不认识,这就是所谓的”乱码“。
在网页上点击鼠标右键查看编码一项,可以看出,浏览器自动选择了”UTF-8“:
如果强制转为GB2312,那么就会产生乱码:
计算机最开始只有ASCII编码,包含了字母、数字、一些标点符号和特殊符号。
但是随着计算机广泛运用,ASCII越来越不能满足计算机发展需要。
不同的编码获得的内容不同。
.net中直接提供了
Encoding.ASCII
Encoding.Unicode
Encoding.UTF32
Encoding.UTF7
Encoding.UTF8
Encoding.Unicode
Encoding.UTF32
Encoding.UTF7
Encoding.UTF8
可以使用,
如果要使用其他编码,可以使用如下方式,例如使用GB2312编码:
Dim enc As Encoding enc = Encoding.GetEncoding("gb2312")
.net还提供了
Encoding.Default
这也是后面几节代码中主要用到的,虽然.net不提倡用:
我这里使用主要是为了简化。实际文本编码的时候最好请使用Unicode编码。
下一节,我将用一个简单的例子说明。
学习更多vb.net知识,请参看
vb.net 教程 目录