我们有一组为ASCII字符集开发的应用程序.现在,我们试图在冰岛安装它,并且遇到问题,冰岛人物正在被困扰.
我们正在努力解决我们的问题,但我想知道:有没有一个很好的“指南”,用于编写专为8位字符设计的C代码,当UTF-8数据被赋予它时,它将正常工作?
我不能指望每个人都阅读整个Unicode标准,但是如果有更多可消化的东西,我想与团队分享,所以我们再也不会遇到这些问题.
此时重新编写所有应用程序以使用wchar_t或其他字符串表示形式是不可行的.我还会注意到,这些应用程序通过网络与使用8位字符的服务器和设备进行通信,因此即使我们在内部进行了Unicode,我们仍然会在边界上进行翻译问题.在大多数情况下,这些应用程序只是传递数据;他们不以任何方式“处理”文本,而不是将其从一个地方复制到另一个地方.
所使用的操作系统是Windows和Linux.我们使用std :: string和纯C字符串. (不要求我保护任何设计决定,我只是想帮助解决这个混乱.)
以下列出了建议的内容:
> The Absolute Minimum Every Software Developer Absolutely,Positively Must Know About Unicode and Character Sets (No Excuses!)
> UTF-8 and Unicode FAQ for Unix/Linux
> The Unicode HOWTO