我正在寻找一种方法来计算由多个角色组成的特殊角色,但在网上找不到解决方案!
对于例如我想数字串“வாழைப்பழம”.它实际上由6个泰米尔字符组成,但在这种情况下,当我们使用常规方法查找长度时,它的9个字符.我想知道泰米尔是唯一会导致此问题的编码,如果有解决方案的话.我目前正在尝试在C#中找到解决方案.
提前谢谢=)
解决方法
使用
StringInfo.LengthInTextElements
:
var text = "வாழைப்பழம"; Console.WriteLine(text.Length); // 9 Console.WriteLine(new StringInfo(text).LengthInTextElements); // 6
有关此行为的说明可以在String.Length的文档中找到:
The Length property returns the number of Char objects in this instance,not the number of Unicode characters. The reason is that a Unicode character might be represented by more than one Char. Use the
System.Globalization.StringInfo
class to work with each Unicode character instead of each Char.