日本語コード

長い間、UnixではEUC(extended unix code), WindowsではshiftJIS, 通信はJISと3つのコードが使われていました。

多言語に対応するためにunicode(32bitコード)が設定され、 その実装としてUTF-8(複数バイトコード)が広く使われるようになっています。 今や、Windows(いまだにshiftJIS)以外のほとんどの マシンでUTF-8が使われているようです。

Windowsのソフトで「UTF-8対応」と書かれていても 全てのUTF-8に対応しているとは限らないのが 現時点での実態です。本来UTF-8では不要なはずの BOM(バイト順マーク)の有無には大体のソフトが対応している ようですが「結合文字列」に対応しているものは少ない。 しかも、MacOSでは「合成文字」よりも「結合文字列」を優先しているので MacからWindowsへファイルを転送すると混乱することがあります。 実際、昨年実験テキストのTeX化作業をやっているときに Macで作成したファイルをWindowsで処理できなくて非常に困りました。 ただし、 Macの方針は「コード化はなるべく少ないバイト数で」というルールに 反していると私は思うのですが・・・

/home/chibaj/public_html/doku/data/pages/7tips/jacode.txt · 最終更新: 2014/01/26 10:05 by junsei
www.chimeric.de Valid CSS Driven by DokuWiki do yourself a favour and use a real browser - get firefox!! Recent changes RSS feed Valid XHTML 1.0