golang 把字符类型单独分离出来,并且使用了不同的语法:
var char = '这'
而用 fmt.Printf("%T",char) 查看其类型,竟然是 int32 这让人奇怪,通常字符组成了字符串,字符串如果只有一个字符长度的话,应当就是字符. 但 golang 的做法改变了这种通常的观点:
字符是数字类型,如果要合并一个字符到字符串中,该怎么办呢?
str := string(char)
golang 预定义了 rune,byte 两种和字符有关的类型,但在显示的时候,却改了名字:
var x byte fmt.Printf("x is %T",x) // x is int8 var y rune fmt.Printf("y is %T",y) // y is int32
这似乎没有必要定义这两种类型,因为 golang 自己的内置函数根本就忽略了它.
另外 golang 和字符串有关的类型也比较混乱,有 string,[]byte,[]rune. 和 string 有关的 strings 模块的输入数据类型大部分是 []string. 而由此引发的数据流就更加混乱,读出的字符串有各种格式.
不过 golang 提供了内置函数对这些数据类型进行相互转换:
var str = "这里输入代码" var chars = []rune(str) var bytes = []byte(str) // 这里就乱了,因为 unicode 字符被 asc 编码了
我想,golang 搞了这么多类型来处理字符串是基于效率的考虑:
- 字符串是不可变(只读)类型
- []byte,[]rune 是切片可变(引用)类型.
- []rune 是为了处理各国语言字符准备的类型
- 传递大文本时,用切片将字符串分割成一个一个小部分进行处理
- 二进制文件,图片文件,压缩文件都是按照 byte 逐个字符处理的.
总之,学习 golang 的字符串,就要明白,传递一个大字符串,最好用引用类型,而处理一个小字符串,使用切片就会变得繁琐.
如何在编码效率和执行效率之间取得平衡,就由程序员自己选择吧.
原文链接:https://www.f2er.com/go/189441.html