2008/01/28

[Linux] 檔案系統轉碼的問題

中文電腦一直以來都有一個問題,就是 big5/gb2312 不夠用, utf8 太晚出來,也太占空間的問題。所以很多網站都還有中文內碼的問題,像是雅虎!台灣網頁就還有很多地方預設都用 big5 的內碼,這點讓許多需要用到多國語言選項的使用者感到困擾及不便。

同樣的,在檔案系統上面也有中文內碼的問題。你會常常看到一堆像這樣: Comment: ���EP - ȫ����Demo������ ww 的東西在中文電腦裡頭跑出來,在 MS Windows 的機器裡頭可能會少點機會,但是一出現就沒辦法處理,開機時還會被 scandisk 處理掉。在 Linux 系統上面沒有檔名沒有辦法處理的問題,但是一樣會跑出來像上面的亂碼,讓你看不懂這個東西是什麼。

然而,開源軟體有它的生命存在,自然會找到它的出路。在 Linux 上面,除了 convmv 可以使用之外,我喜歡用 sshfs 的 iconv 模組來處理 big5 到 utf8 的轉碼問題。一來因為是 fuse 的 mount point ,所以不會一動作就不能回復,二來,可以處理上面同時有 utf8,big5 等多重字碼的情況,應該可以說是最有彈性的處理方式。

使用方法是: sshfs -omodules=iconv,from_code=CP950,allow_other anton@localhost:/home/anton/遠端目錄 /home/anton/近端目錄/

allow_other 這個 option 是讓近端的其它使用者也可以使用這個 mount point ,如果有安全上的考量,可以不要加上去。如果 sshfs 有警告,通常是把 /etc/fuse.conf 裡面的 allow_other 這個選項打開就可以了。

沒有留言:

[Windows] git-bash 底下的工具

因為工作轉到 Windows 平台上的關係,所以很多工具改到 Windows 上面運作,跟著在 TortoiseGit 底下使用 git-bash 來維護自己的專案原始碼。結果就是裝了前面提過的 auto-hotkey 使用熱鍵來提昇自己的平台操作速度; 但除了 hotkey...