Linux下的美化,编码,字体是最累人的。 日文的假名當然可以顯示
但漢字不能顯示
儲存成純文字檔可以
但內核的字符編碼不是那個iso的
檔名編碼也不是
主要是檔案名
因為我常下載動畫看的
下載得多當然要在檔名上寫清濋
但gb有很多字符都顯示不到
例如"Alpha"字母
日文的"戰"這個漢字
(其實就是第三次機械人大戰"Alpha"不能全部顯示...................)
估计换成 utf8 也不能显示,改用日文编码,记得有 JIS 和 EUC 可选。
GB是国家强制标准,在中国发行的软件必须遵守的。
现在好像Linux没有一个比较好的解决方案。
GB180** 和以前的 GBK 不兼容。和 BIG5 也不兼容
用 GB180** 在 telnet 下看newsmth 就会出现 GBK 繁体字变乱码的现象
用 GBK 看法文类的文章会出现 乱码汉字
前面一个 >128 的字符和后面 <128 的英文 组成一个 GBK 字。
GBK 兼容 GB2312
UTF-16 虽然和前面的不兼容,但和英文也不兼容。很容易识别出字符集。
总之 GB180** 是被人诟病的。这个标准都不知道什么人订的。
最符合我们的利益的是 UTF-16 ,但因为这个编码方案 一个英文字符变成
2 Byte 。 所以 开源那帮家伙不感冒,他们更愿用 UTF-8 (中文3 Byte, 英文 1 Byte)。
Unicode 最失败的地方是没把字体和字符分开。
其实我最怕的是:一个汉字分为变长码。那是解决古文字的终极方案。
很高兴的告诉你现在的中文 GB18030 编码方案就是变长的…………
GBK 其实是配合 unicode 的,同时支持 GB2312 (但这样就不是完全符合 unicode 了)。
但是 GBK 做为基础的 unicode 发展到了 4.0 也没有完成全部的编码工作。
短期内中国会出现编码不够的问题,不得以中国只好先提出一个 GB18030 ,这个编码方案和 unicode 方案不同,但他是通过映射的方式支持 GBK ,同时保证了支持国内少数民族文字及亚洲文字编码。但这个并不代表就和 BIG5 、JIS 完美兼容,毕竟他们的方案和 2312 类似,部分地方是重合的。
正统的未来还是 GBK/ISO10646 ,但估计还需要 10 年……… 十年............
等不到我用了............... GB是国家强制标准,在中国发行的软件必须遵守的。
现在好像Linux没有一个比较好的解决方案。
SUSE
Fedora
等等不能在中國發行?? 很高兴的告诉你现在的中文 GB18030 编码方案就是变长的…………
我知道是翻倍变长的
要是一个汉字字符以起始字符+若干描述字符+结束字符
那就麻烦了
日文“戰”和正体“战” 字,应当归为不同字体,但简化字“战”不应当视为同一字。
这类问题以后应当要有个完美解决方法。
有哪个字体是 Unicode 全包的呢?
页:
1
[2]