c – 如何编写UTF-8安全码?

前端之家收集整理的这篇文章主要介绍了c – 如何编写UTF-8安全码?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我们有一组为ASCII字符集开发的应用程序.现在,我们试图在冰岛安装它,并且遇到问题,冰岛人物正在被困扰.

我们正在努力解决我们的问题,但我想知道:有没有一个很好的“指南”,用于编写专为8位字符设计的C代码,当UTF-8数据被赋予它时,它将正常工作?

我不能指望每个人都阅读整个Unicode标准,但是如果有更多可消化的东西,我想与团队分享,所以我们再也不会遇到这些问题.

此时重新编写所有应用程序以使用wchar_t或其他字符串表示形式是不可行的.我还会注意到,这些应用程序通过网络与使用8位字符的服务器和设备进行通信,因此即使我们在内部进行了Unicode,我们仍然会在边界上进行翻译问题.在大多数情况下,这些应用程序只是传递数据;他们不以任何方式“处理”文本,而不是将其从一个地方复制到另一个地方.

所使用的操作系统是WindowsLinux.我们使用std :: string和纯C字符串. (不要求我保护任何设计决定,我只是想帮助解决这个混乱.)

以下列出了建议的内容

> The Absolute Minimum Every Software Developer Absolutely,Positively Must Know About Unicode and Character Sets (No Excuses!)
> UTF-8 and Unicode FAQ for Unix/Linux
> The Unicode HOWTO

解决方法

这看起来像一个全面的快速指南:
http://www.cl.cam.ac.uk/~mgk25/unicode.html

猜你在找的C&C++相关文章