UnicodeとJava

Javaのchar型は最初から長さ16ビットでUnicodeということで, 以前ならマルチバイト文字を考えなくても文字処理ができるということで, ほかのchar型が8ビットの言語と違って楽ができると思ってたんだけど, 最近はUnicodeにもサロゲートペアとかあってchar二つで1文字とかあるから結局また面倒な世界に逆戻りしてしまってたりする。

Win32もwchar_t型は16ビットのはずだから, 手間としては同じなんだろうけど, 所詮すべての文字を16ビットで表現するというのが幻想だったというわけで, wchar_tが32ビットのシステムに戻りたいね。