よねろぐ: コメント: 文字コードの扱い方

コメント: 文字コードの扱い方

元々、Windows標準は何かは知りませんが、日本語に関してはShift-JISでしたよね?(2000、XPからは *一部* UTF-8?)
UTF-8はUnicodeで、世界各国の言語が表示可能なので世界共通という意味では良いのでは?
因みにMacOSXはUnicode(UTF-8??)を採用しているので各国毎のシステムインストールメディアは存在せず、全て共通／同じシステムでほぼ全ての言語に対応できるとのことです。

e-words.jpより引用>>
　UTF-8では、Unicodeの最初の128文字(UCS-2でいうU+0000からU+00FF)を変換した結果がASCIIとまったく同じになるため、従来の処理システムとの親和性が高いという特長がある。一方、日本語などの文字は元々2バイトだったものが3バイトや4バイトで表現されてしまうため、UTF-16と比べてデータサイズが大きくなってしまうという欠点がある。

　ちなみに、UTF-16ではUCS-4を完全に表現することはできないが、理論上はUTF-8はUCS-4を完全に表現できる。

投稿者 *BSD : 2004年01月17日 02:18