想象一下,你有一个Swift的字符类型的实例,你想要确定它是否是一个NSCharacterSet的成员。 NSCharacterSet的characterIsMember方法需要一个unichar,所以我们需要从Character到unichar。
我可以想出的唯一解决方案是以下,其中c是我的性格:
let u: unichar = ("\(c)" as NSString).characterAtIndex(0) if characterSet.characterIsMember(u) { dude.abide() }
我看着字符,但没有跳跃在我作为一种方式从它到unichar。这可能是因为字符比unichar更通用,所以直接转换不会是安全的,但我只是猜测。
如果我迭代一个整个字符串,我会做这样的事情:
let s = myString as NSString for i in 0..<countElements(myString) { let u = s.characterAtIndex(i) if characterSet.characterIsMember(u) { dude.abide() } }
(警告:以上是伪代码,从来没有任何人曾经运行过。)但这不是我真正的问题。
我的理解是unichar是一个typealias UInt16。 unichar只是一个数字。
我认为你面临的问题是,Swift中的一个字符可以由多个unicode“字符”组成。因此,它不能被转换为单个unichar值,因为它可以由两个unichar组成。您可以通过将字符转换为字符串并使用utf16属性将字符分解为各个unichar值,如下所示:
let c: Character = "a" let s = String(c) var codeUnits = [unichar]() for codeUnit in s.utf16 { codeUnits.append(codeUnit) }
这将产生一个数组 – codeUnits – unichar值。
编辑:初始代码已为codeUnit在s时,它应该是为sUut中的codeUnit
你可以整理和测试每个单独的unichar值是否是这样的字符集:
let char: Character = "\u{63}\u{20dd}" // This is a 'c' inside of an enclosing circle for codeUnit in String(char).utf16 { if NSCharacterSet(charactersInString: "c").characterIsMember(codeUnit) { dude.abide() } // dude will abide() for codeUnits[0] = "c",but not for codeUnits[1] = 0x20dd (the enclosing circle) }
或者,如果你只对第一个(通常只有)unichar值感兴趣:
if NSCharacterSet(charactersInString: "c").characterIsMember(String(char).utf16[0]) { dude.abide() }
或者,将其包装在一个函数中:
func isChar(char: Character,inSet set: NSCharacterSet) -> Bool { return set.characterIsMember(String(char).utf16[0]) } let xSet = NSCharacterSet(charactersInString: "x") isChar("x",inSet: xSet) // This returns true isChar("y",inSet: xSet) // This returns false
现在使函数检查组合字符中的所有unichar值 – 这样,如果你有一个组合字符,该函数将只返回true如果基本字符和组合字符存在:
func isChar(char: Character,inSet set: NSCharacterSet) -> Bool { var found = true for ch in String(char).utf16 { if !set.characterIsMember(ch) { found = false } } return found } let acuteA: Character = "\u{e1}" // An "a" with an accent let acuteAComposed: Character = "\u{61}\u{301}" // Also an "a" with an accent // A character set that includes both the composed and uncomposed unichar values let charSet = NSCharacterSet(charactersInString: "\u{61}\u{301}\u{e1}") isChar(acuteA,inSet: charSet) // returns true isChar(acuteAComposed,inSet: charSet) // returns true (both unichar values were matched
最后的版本很重要。如果你的角色是一个组合的角色,你必须检查基本字符(“a”)和组合字符(急性重音)在字符集的存在,否则你会得到假阳性。