想不明白的编码问题
智能拼音、微软拼音或者fctix,用他们输入的汉字是什么编码?gb2312还是unicode?如果一段文字,其中既有gb2312又有unicode,在几种文本编辑器vi、emacs、gedit、MS WORD里,看上去有区别吗,或者能区分出来吗? win用的是gb2312
如果在一段文字中出现混和编码,差不多肯定是区分不了
Re: 想不明白的编码问题
智能拼音、微软拼音或者fctix,用他们输入的汉字是什么编码?gb2312还是unicode?看你启动它们时的locale了。
如果一段文字,其中既有gb2312又有unicode,在几种文本编辑器vi、emacs、gedit、MS WORD里,看上去有区别吗,或者能区分出来吗?
当然可以,看你文本保存为什么编码了,如果文本是保存为gb2312编码的,UTF-8编码的汉字就是乱码。反之,gb2312的汉字就是乱码。 谢谢
但是在notepad里好像UTF8、gb2312都可以正确显示 很多文本编辑器如Notepad可以识别多种文字编码格式,但是整个文档必须使用统一的编码格式,否则也不能正确显示。
除非一些编辑工具可以将编码信息分块保存,好像还需要一些额外的动作,才能得到多编码格式的一份文档。除了特殊需要,一般没有必要吧。 我是怕混合了不同编码自己还不知道
自己看着没事,等拿出去发布的时候混着乱码就麻烦了 很多文本编辑器如Notepad可以识别多种文字编码格式,但是整个文档必须使用统一的编码格式,否则也不能正确显示。
除非一些编辑工具可以将编码信息分块保存,好像还需要一些额外的动作,才能得到多编码格式的一份文档。除了特殊需要,一般没有必要吧。
比如說要顯示簡體字和繁體字混和的文本,要是能自動區分不同的編碼該是多好。
页:
[1]