arzon 发表于 2004-9-1 13:44:50

想不明白的编码问题

智能拼音、微软拼音或者fctix,用他们输入的汉字是什么编码?gb2312还是unicode?
如果一段文字,其中既有gb2312又有unicode,在几种文本编辑器vi、emacs、gedit、MS WORD里,看上去有区别吗,或者能区分出来吗?

cobranail 发表于 2004-9-1 18:18:26

win用的是gb2312
如果在一段文字中出现混和编码,差不多肯定是区分不了

lori 发表于 2004-9-1 19:37:17

Re: 想不明白的编码问题

智能拼音、微软拼音或者fctix,用他们输入的汉字是什么编码?gb2312还是unicode?
看你启动它们时的locale了。

如果一段文字,其中既有gb2312又有unicode,在几种文本编辑器vi、emacs、gedit、MS WORD里,看上去有区别吗,或者能区分出来吗?
当然可以,看你文本保存为什么编码了,如果文本是保存为gb2312编码的,UTF-8编码的汉字就是乱码。反之,gb2312的汉字就是乱码。

arzon 发表于 2004-9-2 11:34:57

谢谢
但是在notepad里好像UTF8、gb2312都可以正确显示

zuohuijun 发表于 2004-9-2 12:22:19

很多文本编辑器如Notepad可以识别多种文字编码格式,但是整个文档必须使用统一的编码格式,否则也不能正确显示。

除非一些编辑工具可以将编码信息分块保存,好像还需要一些额外的动作,才能得到多编码格式的一份文档。除了特殊需要,一般没有必要吧。

arzon 发表于 2004-9-2 14:02:53

我是怕混合了不同编码自己还不知道
自己看着没事,等拿出去发布的时候混着乱码就麻烦了

jackieupc 发表于 2004-9-12 23:54:19

很多文本编辑器如Notepad可以识别多种文字编码格式,但是整个文档必须使用统一的编码格式,否则也不能正确显示。

除非一些编辑工具可以将编码信息分块保存,好像还需要一些额外的动作,才能得到多编码格式的一份文档。除了特殊需要,一般没有必要吧。

比如說要顯示簡體字和繁體字混和的文本,要是能自動區分不同的編碼該是多好。
页: [1]
查看完整版本: 想不明白的编码问题