想不明白的编码问题

arzon 发表于 2004-9-1 13:44:50

智能拼音、微软拼音或者fctix，用他们输入的汉字是什么编码？gb2312还是unicode？
如果一段文字，其中既有gb2312又有unicode，在几种文本编辑器vi、emacs、gedit、MS WORD里，看上去有区别吗，或者能区分出来吗？

cobranail 发表于 2004-9-1 18:18:26

win用的是gb2312
如果在一段文字中出现混和编码，差不多肯定是区分不了

lori 发表于 2004-9-1 19:37:17

Re: 想不明白的编码问题

智能拼音、微软拼音或者fctix，用他们输入的汉字是什么编码？gb2312还是unicode？
看你启动它们时的locale了。

如果一段文字，其中既有gb2312又有unicode，在几种文本编辑器vi、emacs、gedit、MS WORD里，看上去有区别吗，或者能区分出来吗？
当然可以，看你文本保存为什么编码了，如果文本是保存为gb2312编码的，UTF-8编码的汉字就是乱码。反之，gb2312的汉字就是乱码。

arzon 发表于 2004-9-2 11:34:57

谢谢
但是在notepad里好像UTF8、gb2312都可以正确显示

zuohuijun 发表于 2004-9-2 12:22:19

很多文本编辑器如Notepad可以识别多种文字编码格式，但是整个文档必须使用统一的编码格式，否则也不能正确显示。

除非一些编辑工具可以将编码信息分块保存，好像还需要一些额外的动作，才能得到多编码格式的一份文档。除了特殊需要，一般没有必要吧。

arzon 发表于 2004-9-2 14:02:53

我是怕混合了不同编码自己还不知道
自己看着没事，等拿出去发布的时候混着乱码就麻烦了

jackieupc 发表于 2004-9-12 23:54:19

很多文本编辑器如Notepad可以识别多种文字编码格式，但是整个文档必须使用统一的编码格式，否则也不能正确显示。

除非一些编辑工具可以将编码信息分块保存，好像还需要一些额外的动作，才能得到多编码格式的一份文档。除了特殊需要，一般没有必要吧。

比如說要顯示簡體字和繁體字混和的文本，要是能自動區分不同的編碼該是多好。

页: [1]

中国Linux公社论坛's Archiver

想不明白的编码问题

Re: 想不明白的编码问题