« ワン切りでないワン切り電話 | トップページ | ジェフ市原3-2大分トリニータ »

2004/06/19

Unicodeで你好

このココログは「Unicode」という文字コードが使われています。当初「シフトJISとは違うのね」くらいの意識しかなかったのですが、このコードは日本や繁体字・簡体字の漢字ももちろん、ありとあらゆる世界の文字を一手に扱う文字コードらしいということを最近知りました(^^;)。

シフトJIS民族(?)だった私達にとって、古くはパソコン通信(懐かしいね)から今のホームページで台湾や中国の事を伝えようとする時に必ずぶち当たる壁が「地名などで使われている漢字が表示できない」という問題でした。これを克服するためには、例えば台湾の客車急行の事を「呂光(※「呂」は草かんむりに「呂」)」とか、「[廾/呂]光」みたいな涙ぐましい努力(ちょっと大げさか)をして表現していました。だいたい中国語の挨拶からして「[イ尓]好」ですから([]内は1文字という意味です)。

ところがUnicodeだとそれらが日本語の文字と共に表示出来るんですね。「你好」「莒光」←ほらね。

問題は表示が出来ても入力はどうするかという話ですが、最近のIMEでは日本語環境で中国語の文字も入力出来るみたいですがとりあえず手っ取り早いのは中国語のホームページから文字を拾ってきてテキストボックスに貼り付けるという方法。例えば台湾国鉄の駅名なら台湾国鉄のページを使えば全駅名の漢字が手に入ります(^^)。

ココログはテキストボックスがUnicodeに対応しているのでこれでOKですが、自分のHPでこれらの文字を表示しようとするともう一工夫必要。私の愛用しているテキストエディタはUnicode形式の読み書きが出来ても文字そのものは扱えません。そこで、
1.中国文字をまず Microsoft Word に貼り付ける。(Wordは「你好」「莒光」の文字が表示できます)
2.Webページとして保存する(この時ファイル名に中国文字を利用しない様に注意)
3.保存したページをテキストエディタで開く。この中で 「你好」「莒光」は「你好」「莒光」の様に、日本の漢字に無い文字がコードの特殊表現に変わっています。
4.あとはホームページのソースの中で、この文字列を <span lang="zh">&#20320;好</span> てな感じで「ここだけ中国語」を示すタグに挟み込んで埋め込み、ファイル自体をUnicode形式で保存すればOKのようです。もう少しうまい方法はあるかもしれませんが。

Unicodeは本来違う漢字を1つのコードにまとめてしまっている等の問題もあるようですが、いずれはネットもパソコンの世界もこの文字コードが主流になるかもしれませんね。

|

« ワン切りでないワン切り電話 | トップページ | ジェフ市原3-2大分トリニータ »

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/20962/798736

この記事へのトラックバック一覧です: Unicodeで你好:

« ワン切りでないワン切り電話 | トップページ | ジェフ市原3-2大分トリニータ »