(现在为Swift 3更新了所有代码示例.)
原文链接:https://www.f2er.com/swift/319266.html将Swift字符串与<比较做词典比较
基于所谓的“Unicode Normalization Form D”(可以用.计算)
decomposedStringWithCanonicalMapping)
例如,分解
"ä" = U+00E4 = LATIN SMALL LETTER A WITH DIAERESIS
是两个Unicode代码点的序列
U+0061,U+0308 = LATIN SMALL LETTER A + COMBINING DIAERESIS
出于演示目的,我编写了一个小的String扩展来转储
String的内容作为Unicode代码点的数组:
extension String { var unicodeData : String { return self.unicodeScalars.map { String(format: "%04X",$0.value) }.joined(separator: ",") } }
现在让我们拿一些字符串,用<:对它们进行排序
let someStrings = ["ǟψ","äψ","ǟx","äx"].sorted() print(someStrings) // ["a","ã","ă","ä","ǟ","b"]
并转储每个字符串的Unicode代码点(原始和分解
form)在排序数组中:
for str in someStrings { print("\(str) \(str.unicodeData) \(str.decomposedStringWithCanonicalMapping.unicodeData)") }
äx 00E4,0078 0061,0308,0078 ǟx 01DF,0304,0078 ǟψ 01DF,03C8 0061,03C8 äψ 00E4,03C8
很好地表明,比较是通过Unicode的词典排序完成的
分解形式的代码点.
对于多个字符的字符串也是如此,如下例所示
显示.同
let someStrings = ["ǟψ","äx"].sorted()
上面循环的输出是
äx 00E4,03C8
意思就是
"äx" < "ǟx",but "äψ" > "ǟψ"
(这对我来说至少是意料之外的).
最后让我们将它与区域敏感的排序进行比较,例如瑞典语:
let locale = Locale(identifier: "sv") // svenska var someStrings = ["ǟ","a","b"] someStrings.sort { $0.compare($1,locale: locale) == .orderedAscending } print(someStrings) // ["a","b","ǟ"]
如您所见,结果与Swift<排序.