QQ登录

只需一步,快速开始

 找回密码
 注册

QQ登录

只需一步,快速开始

查看: 6626|回复: 34

教你搞定UTF8乱码问题

[复制链接]
发表于 2007-3-9 08:24:33 | 显示全部楼层 |阅读模式
我昨天刚装的ML2.0,以前接触的是其他发行版,主要是国外的。总的来说,这个版本非常合适家庭用户使用,简单到也不用什么配置,也不用担心什么病毒。多媒体、上网、中文都支持很好。

这里说一下UTF8带来的乱码问题。我原来用的都是UTF8编码,发现新装的ML是GB18030编码,因此中文文件名都是乱码。解决方法如下:
修改/etc/sysconfig/i18n文件,把zh_CN.GB18030都改成zh_CN.UTF8。就可以了。

对于使用gftp做ftp传输的用户,需要给gftp打上一个补丁再编译,就可解决登陆服务器时候的乱码。方法如下:
tar jxvf gftp-2.0.18.tar.bz2
patch -p0 < gftp_remote_charsets.patch
cd gftp-2.0.18
./configure
make
sudo make install

编辑文件,没有则加入新一行:
$cd ~/.gftp
$vi gftprc
remote_charsets=CP936,GB18030,GBK,GB2312,UTF-8

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

×
发表于 2007-3-9 09:07:42 | 显示全部楼层
这不是好的解决办法,ml是针对gb编码制作发行版的,你这样在其它地方还会有乱码的。
最好的办法是用convmv转utf-8为gb
回复

使用道具 举报

 楼主| 发表于 2007-3-9 09:15:27 | 显示全部楼层
我早已习惯了UTF8,不过你说的也是一个尝试。

请问那个convmv能转变所有的文件名和文件夹名吗?能转变文件内容的编码方式吗?
在哪里下载?
回复

使用道具 举报

发表于 2007-3-9 09:40:22 | 显示全部楼层
在仓库里有,习惯了utf-8的话,应该选择以utf-8为主的发行版,我们的很多补丁是针对gb的。当然可能影响不大。
convmv是转文件名,文件内容要用iconv,其实ml还带了autoconvert,可以转换文件内容,比较简单,而且有一定的自动程度。
回复

使用道具 举报

发表于 2007-3-9 11:12:48 | 显示全部楼层
convmv建议集成到下个版本中

convmv -fgbk -tutf8 ./* --notest

convmv -futf8 -tgbk ./* --notest
回复

使用道具 举报

发表于 2007-3-9 12:45:27 | 显示全部楼层
GB18030 是中国所有非手持/嵌入式计算机系统的强制实施标准
回复

使用道具 举报

发表于 2007-3-9 16:28:47 | 显示全部楼层
楼主尽出馊主意,magic 是针对 gb18030 制作的发行版,符合国家规范。你使用 utf-8,读写 windows 分区上的文件难道就没有问题么?你写一个文件到 windows 分区上,打开 windows  看看是什么样子。
回复

使用道具 举报

发表于 2007-3-9 16:38:53 | 显示全部楼层
我用EVL有不少时间,其实用什么样的编码都是一样的,从国内的应用主流和国家强制的标准来看,utf8不能成为中文Linux桌面的标准,Ubuntu虽然流行,可是utf8并不因为Ubuntu默认的utf8编码而流行,很多开源软件在gb18030编码下能够显示中文,但却不提供utf8的中文支持,事实上应该是大多数人的习惯决定了一切,13亿中国人有多少用utf8码浏览的?我们所看到的中文Web页几乎全是gb码的,我所接触的所有软件似乎没有一款是只支持UTF8中文而不支持国标的。

不过如果补丁可以自动识别编码的话倒是另外一谈。
回复

使用道具 举报

发表于 2007-3-9 16:59:58 | 显示全部楼层
用utf-8(我的arch)
文件系统的文件名是不会有问题的,只要fstab配置没问题
网页也问题 不大,英文浏览器大都支持多内码,顶多手动干预一下。

我碰到的主要是MP3和多媒体文件的字幕问题。

后者我用mplayer 命令行播放时指定来解决。

还有下载的文件,bt,驴子的文件名有时有问题(可能是包维护者有时有解决好有时没有,
arch包更新很快)

gb和utf-8目前看不出优劣。

但我支持mgc用gb编码。
回复

使用道具 举报

发表于 2007-3-9 17:03:34 | 显示全部楼层
现在其实utf-8和gb系列编码都有问题,不过既然gb18030是强制标准,遵守就是了,又不多难,utf-8也没多好。
回复

使用道具 举报

发表于 2007-3-9 18:19:02 | 显示全部楼层
[quote:15ce2183e1="sejishikong"]现在其实utf-8和gb系列编码都有问题,不过既然gb18030是强制标准,遵守就是了,又不多难,utf-8也没多好。[/quote]同意
回复

使用道具 举报

发表于 2007-3-9 18:42:40 | 显示全部楼层
gmail 发的 utf-8 编码的中文信,国内很多邮箱收到后都是乱码。
回复

使用道具 举报

发表于 2007-3-9 20:54:56 | 显示全部楼层
xrkh, 那个问题要么是 GMail 的问题,要么就是国内邮箱提供商都有问题。
我记得 email 文件体的头部是可以含有编码信息的。
回复

使用道具 举报

发表于 2007-3-9 20:57:02 | 显示全部楼层
[quote:91e6d4d6dc="KDE"][quote:91e6d4d6dc="sejishikong"]现在其实utf-8和gb系列编码都有问题,不过既然gb18030是强制标准,遵守就是了,又不多难,utf-8也没多好。[/quote]同意[/quote]
相对来说,GB18030 兼容旧的 GB2312 和 GBK 。相对方便点。
等 unicode 完全包含了亚洲文字再考虑换编码的问题吧………………

不然换来换去的。数据丢失是早晚的事情。
回复

使用道具 举报

发表于 2007-3-10 00:53:45 | 显示全部楼层
[quote:bab7cb222d="jiangtao9999"]xrkh, 那个问题要么是 GMail 的问题,要么就是国内邮箱提供商都有问题。
我记得 email 文件体的头部是可以含有编码信息的。[/quote]
估计是国内邮箱的通病

用雅虎收 gmail 的 utf-8 邮件乱码,但自定义编码后就能正常显示
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

GMT+8, 2024-11-24 06:41 , Processed in 0.112913 second(s), 16 queries .

© 2021 Powered by Discuz! X3.5.

快速回复 返回顶部 返回列表