关于UTF-8和GB2312-80的疑惑 区别和联系?
我理解的是首先UTF-8是在Unicode下发展出来的,是为了一些系统按 8 位来处理的 Unicode 形式。
而Unicode是为了不同进程间的数据通讯以及程序的数据输入才出现的一种编码。
GB2312-80对任意一个图形字符(或者说汉字)都采用16位表示。
他们有什么区别和联系?
比如:我先在一个窗口里copy一些中文到另一个窗口。计算机处理的时候是不是先把中文(GB2312)转换成Unicode格式然后在另一个窗口转换回GB2312的?既然都是GB的不转换会怎么样?
请高手说明一下谢谢 GB2312和Unicode是不同编码形式。
UTF-8是Unicode的8位通讯方式,对应的还有UTF-16这是Unicode的16为通讯方式。
系统在进程中通讯时根据设置使用不同的通讯编码。 这个之前有讨论,当时讨论的是gbk/gb18030/gb2312,utf8也是一个道理
中文字体文件中每个汉字的位置是固定的,各种编码的不同之处在于字体文件中汉字字型的偏移量和汉字标记的对应关系。
GB2312是GBK和GB18030的一个子集,如果使用GBK/GB18030编码,GB2312编码的字符可以直接正常显示而不用经过转换。
页:
[1]