locale为zh_CN.UTF8的问题 - 第2页 - Magic Linux技术支持区 - 中国Linux公社论坛

xLoneStar 发表于 2004-10-19 14:31:22

liguangyi, 所有的 iso2022 编码方式的多字节字符集 MBCS，本质上都是潜藏着问题的。所以并非 GB18030 或者 Big5 特别的脑子进水——这一类编码就是这个样子。这就是为什么国际上急着要抛弃 MBCS 方案转向统一码的原因。

但就如上述，这种转换是很痛苦的。即使你能将你系统上所有文件名改成 unicode，能改国内各个 ftp 上的文件名吗？能改无数 mp3 以及里面的 ID3 标记吗？用了 zh_CN.UTF8 后，能接受所有文本文件都变成乱码的情况吗？

情况是复杂的，大家也都在想办法。太激进无助于事，当然保守固执到偏见就更不好了。

atfa 发表于 2005-4-25 23:14:17

关键是我们下载的大多数文件都是gbk编码的

jiangtao9999 发表于 2005-4-26 08:56:41

GB18030 还是很先进的，但就是有人不支持它。
非要用什么UTF8…………

要知道 GB18030 支持繁简和中国的少数民族文字。

　　GB 18030收录了27484个汉字，总编码空间超过150万个码位，为解决人名、地名用字问题提供了方案，为汉字研究、古籍整理等领域提供了统一的信息平台基础。

　　目前，我国大部分计算机系统仍然采用GB 2312编码。GB 18030与GB 2312一脉相承，较好地解决了旧系统向新系统的转换问题，并且改造成本较小。从我国信息技术和信息产业发展的角度出发，考虑到解决我国用户的需要及解决现有系统的兼容性和对多种操作系统的支持，采用GB 18030是我国目前较好的选择，而GB 13000.1更适用于未来国际间的信息交换。考虑到GB 18030和GB 13000的兼容问题，标准起草组编制了GB 18030与GB 13000.1的代码映射表，使得两个编码体系可以自由转换。同时，还开发了GB 18030基本点阵字型库。

　　世界许多国家和地区从方便本国和民族应用的角度出发，制定了相应的编码标准和内码体系，如日本的JIS X 0208和JIS X 0212，韩国的KS C 5601和KS C 5657等，这是国际上采用的通行惯例。制定GB 18030同样符合国际惯例，它全面兼容GB 2312，在字汇上兼容GB 13000.1，可以充分利用已有资源，保证不同系统间的兼容性，最大限度地共享资源，为我国软件产业留有巨大的发展空间。可以相信，GB 18030的实施将有利于国产软件的发展并形成规模，使我国的中文信息技术再上一个台阶。

GB18030 支持用了20年的 GB2312 啊！

要知道当年小日本是看了中国的编码方案才制定出他们自己的编码方案！

liguangyi 发表于 2005-4-26 11:04:53

我们在和台湾、香港，还有国外一些公司合作，进行系统数据交换的时候，唯一使用的就是unicode/utf8。因为我们这边儿决不使用big5，他们也决不会使用gb2312，更不可能使用gb18030。现在unicode/utf8的应用遍地都是，象xml编码，web页面，google搜索，大多数数据库的unicode支持也是采用utf8方式...... 可是有谁真正用过gb18030作应用呢？

xLoneStar 发表于 2005-4-26 17:07:09

大约在96、97年间，我阅读 PC/Magazine 时看到一则微软 Office 产品的广告，画面是一个类似于电子表格的窗口，里面有十多种国家的语言写着的同一句话，最后两行是简体中文和繁体中文。广告语原文记不清了，大致意思是：“当世界需要沟通时，请用统一码”。

这句话至今仍有效——当沟通成为主要需求时，Unicode 是你唯一选择，否则的话，当然随便你爱用什么编码就用什么了。

页: 1 [2]

中国Linux公社论坛's Archiver