如何找到WINDOWS-1252字符的内部代码表示?

前端之家收集整理的这篇文章主要介绍了如何找到WINDOWS-1252字符的内部代码表示?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我正在处理来自问卷的SPSS数据,该问卷必须来自M $Word. Word会自动将连字符更改为长连字符,并转换为无法正确显示的字符,即“ – ”变为“ú”.

我的问题:WINDOWS-1252字符集中的utf8ToInt()相当于什么?

utf8ToInt("A")
[1] 65

当我使用自己的数据执行此操作时,出现错误

x <- str_sub(levels(sd$j1)[1],7,7)
print(x)
[1] "ú"

utf8ToInt(x)
Error in utf8ToInt(x) : invalid UTF-8 string

但是,x的内容在grep和gsub表达式中完全可用.

> Sys.getlocale()
[1] "LC_COLLATE=English_United Kingdom.1252;LC_CTYPE=English_United Kingdom.1252;LC_MONETARY=English_United Kingdom.1252;LC_NUMERIC=C;LC_TIME=English_United Kingdom.1252"
如果通过read.spss form package foreign加载SPSS sav文件,则可以通过指定编码来轻松导入具有正确编码的数据帧:
read.spss("foo.sav",reencode="CP1252")

猜你在找的Windows相关文章