找回密码
 注册
楼主: KDE

关于gnome2.3.1请cjacker和llc注意

[复制链接]
 楼主| 发表于 2003-5-24 15:16:23 | 显示全部楼层
[quote:45f0e9f1a5="Fujinsan"][quote:45f0e9f1a5="KDE"][quote:45f0e9f1a5="Fujinsan"]问题是搜集那么多的词汇可不是轻松的事。[/quote]
我们 i18n 小组曾经讨论过这些事情,可是由于大家标准不统一,还是成了黄花菜,不过做这个脚本并不难。[/quote]

我记得以前两岸的计算机专家曾经召开过一次关于协商两岸计算机术语问题的会议,不知网上有无这方面的资料。
脚本写成了,词汇表的格式就定下来了,大家按照这个格式收集整理,按照习惯用法,参照llc用的那个Win下的工具,应该可以解决了。
这项工作可以在公社组织一个小组来进行。KDE,你来召集人来做一下,如何?这也是公社的社员由普通用户转向维护开发的一个突破口,我相信会有很多人愿意参加的。[/quote]
脚本我已经搞定了,就是词典需要商榷。一看你就是搞计划的——光说不练:-)跟我联络,请加入 i18n.linux.net.cn 的邮件列表。QiuShi
回复

使用道具 举报

发表于 2003-5-24 15:26:53 | 显示全部楼层
光说不练

想练也练不起来啊。我现在上网不太方便,又忙于生计。
回复

使用道具 举报

发表于 2003-5-24 15:38:56 | 显示全部楼层
繁体转简体替换表在此,已经包括我平时自己收集的一些习惯用语的转换

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

×
回复

使用道具 举报

发表于 2003-5-24 15:41:12 | 显示全部楼层
呵呵,搞定了。恭喜!
回复

使用道具 举报

 楼主| 发表于 2003-5-24 16:15:25 | 显示全部楼层
[quote:59a675f356="llc"]繁体转简体替换表在此,已经包括我平时自己收集的一些习惯用语的转换[/quote]
繁简体中文转换可以用 autoconvert 工具,不过我没用过。我是指两岸习惯用语的转换有待商榷。我们邮件列表里早就有人提供了一个大词典,将近两千条,我正在做筛选……
回复

使用道具 举报

发表于 2003-5-24 19:15:26 | 显示全部楼层
[quote:dd37c4f623="KDE"][quote:dd37c4f623="llc"]繁体转简体替换表在此,已经包括我平时自己收集的一些习惯用语的转换[/quote]
繁简体中文转换可以用 autoconvert 工具,不过我没用过。我是指两岸习惯用语的转换有待商榷。我们邮件列表里早就有人提供了一个大词典,将近两千条,我正在做筛选……[/quote]
呵呵,那可就耗点时间了
回复

使用道具 举报

 楼主| 发表于 2003-5-25 00:07:35 | 显示全部楼层
词典越大,处理时间越长,先提供一个小词典:
作业系统#操作系统
作业失败#操作失败
组态档#配置文件
字元#字符
资讯#信息
注解#备注
伫列名称#队列名
置换#替换
指令列#命令行
指令#命令
执行绪#线程
侦测#检测
遮罩#掩码
站台#站点
暂存盘目录#临时目录
暂存档#临时文件
预设值#默认值
於#于
硬碟机#硬盘驱动器
萤幕#屏幕
印表机#打印机
隐藏档#隐藏文件
讯息#消息
讯号#信号
选取#选定
选单#菜单
新增#添加
撷取档案#捕获文件
相容性#兼容性
物件#对象
文字领域#文本域
位元组#字节
文法#语法
缩排#缩进
输入档#输入文件
软体#软件
软式磁碟机#软盘驱动器
全球资讯网#万维网
乾#干
洽询#联系
偏好设定#首选项
末端的#行末的
命令稿#脚本
列印#打印
链结#链接
连络#联系
连结#链接
离开#退出
开启#打开
巨集#宏
进阶#高级
检视#查看
记忆体#内存
汇入#导入
汇出#导出
回信#回复
回馈#反馈
回复#恢复
回传值#返回值
後#后
光碟#光盘
沟通#通信
更名#重命名
覆#复
副程序#子进程
复原#撤消
二元码#二进制码
档名#文件名
档案#文件
档#文件
磁碟机代号#驱动器号
磁碟标签#磁盘卷标
抽取式磁碟#可移动磁盘
磁碟#磁盘
程式#程序
查询#搜索
埠#端口
表示式#表达式
变数#变量
备份档#备份文件
远端#远程
元件#组件
预设#默认
语系#语境
」#”
「#“
回复

使用道具 举报

 楼主| 发表于 2003-5-25 00:36:44 | 显示全部楼层
贴出脚本。您需要准备三个空目录:dic、target、done。其中:
dic 用于存放词典文件 t2s.dic (如上贴)。注意,词典文件不能有空行和标点符号,在最后一个词条的后面不要按回车键!
target 目录用于存放待处理文件,可以是任意文本文件。
done 目录用于存放处理后的文件。
使用方法:在控制台下输入 sh ./t2s.sh 即可。

脚本 t2s.sh
------------------
#!/bin/sh
# 繁简体中文习惯用语对译工具 T2S 0.1
# Come From AutoWork Toolkits.
# Welcome to our team: http://i18n.linux.net.cn
# Copyleft Liu Songhe 2003.
export basedir=`pwd`
export dic="$basedir/dic/t2s.dic"
sh ./replace.sh `wc -l $dic`


脚本 replace.sh
------------------
#!/bin/sh
export tc=""
export sc=""
export count=1
export line=`expr $1 + 1`
file=""
cd ./target
for file in *
do
if test -f "$file"
then
export file
cat "$file" | sh "$basedir/look.sh"
fi
done


脚本 look.sh
------------------
#!/bin/sh
if test $count -le $line
then
export tc=`sed -n "$count"p $dic | awk -F# '{print $1}'`
export sc=`sed -n "$count"p $dic | awk -F# '{print $2}'`
export count=`expr $count + 1`
sed -e "s/$tc/$sc/g" - | "$basedir/look.sh"
exit
fi
cat - > "$basedir/done/$file"




-------------------------
如果觉得值得采用,请把脚本和词典贴到翻译区,谢谢。
回复

使用道具 举报

发表于 2003-5-25 07:13:52 | 显示全部楼层
好,搜集的不少啊。
回复

使用道具 举报

 楼主| 发表于 2003-5-25 08:49:09 | 显示全部楼层
不够!词条太少啦!若要使用,词典至少200-300条,我只是放出了很小一部分词典。现在经过测试发现,替换(win2k+cygwin)会有些小错误(个别地方出现乱码,不过问题不严重),转码用的是 emeditor 的繁简转换插件,可我感觉好像是某个指令有 BUG 而不是脚本。不是sed就是awk。我通过递归调有的方法将所有词典中的词条纳入一个闭合的管道反复过滤目标文件,直到遍历整个词典。这可以避免使用临时文件。但如此深的递归调用对任何软硬件都是一种考验。可能会暴露一些BUG。实践表明,gettext 0.11.x 就有严重的 BUG,不过不在极端场合下暴露不出来,新的 0.12 版已经修正了所有错误,大家可以试试。哪位大侠再测试一下。我看可以先用着,替换后再手工校对一下。不过用脚本就是慢了点,哪位可以用 c 语言实现一下?另外需要注意,词典的排列是先用内码排序,然后长词条在前,短的在后,后一点千万注意。哪位可以写一个排序脚本?
回复

使用道具 举报

发表于 2003-5-25 12:23:25 | 显示全部楼层
最好能有位兄弟搞个gui版本,然后习惯用语文件独立,可以自己增加
回复

使用道具 举报

 楼主| 发表于 2003-5-25 12:41:40 | 显示全部楼层
我只会一点 shell 编程,不过上面的脚本已经是傻瓜化的了。只要把几个文件放在 target 目录下,执行 sh ./t2s.sh 就可以在 done 目录下找到处理后的文件。
^_^
经高手指点,认为替换后个别地方出现乱码的问题可能是 sed 的 BUG !比如:
不允许有参数--->不允许缨游数
这是因为:相邻两个汉字的内码会组成另一个汉字,导致误导替换。尤其在短的替换时。与我的脚本无关!
回复

使用道具 举报

 楼主| 发表于 2003-5-26 21:47:29 | 显示全部楼层
才贴出的那个 EMACS 快速指南就是在官方版本基础上,用上述脚本处理得到的!不过使用的词典小了点,今天进一步修订了一下。很遗憾,被贴在技术文档板块的那篇没法修改了。现有的词典有 1700 多条。我准备把脚本移动到翻译汉化板块去,希望能在那里固顶,词典也上传,今后若有新词汇增加或现有词汇值得商榷可以跟帖。不知各位意下如何?
回复

使用道具 举报

发表于 2003-5-27 15:40:23 | 显示全部楼层
[quote:0c348f5990="KDE"]才贴出的那个 EMACS 快速指南就是在官方版本基础上,用上述脚本处理得到的!不过使用的词典小了点,今天进一步修订了一下。很遗憾,被贴在技术文档板块的那篇没法修改了。现有的词典有 1700 多条。我准备把脚本移动到翻译汉化板块去,希望能在那里固顶,词典也上传,今后若有新词汇增加或现有词汇值得商榷可以跟帖。不知各位意下如何?[/quote]

好注意.当然可以.
回复

使用道具 举报

 楼主| 发表于 2003-5-28 23:56:34 | 显示全部楼层
不知那个 autoconvert 在 ML1.1 下编译后为什么不能使用!已经删了。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

GMT+8, 2025-1-9 10:05 , Processed in 0.093081 second(s), 14 queries .

© 2001-2025 Discuz! Team. Powered by Discuz! X3.5.

快速回复 返回顶部 返回列表