C 文字列操作 新しいページはコチラ
提供: yonewiki
(→文字列文字コード変換) |
(→文字列文字コード変換) |
||
2,794行: | 2,794行: | ||
} | } | ||
</syntaxhighlight> | </syntaxhighlight> | ||
+ | という具合に変換すると結果として | ||
+ | <syntaxhighlight lang="text"> | ||
+ | JIS文字列 | ||
+ | 004a:0049:0053:6587:5b57:5217: | ||
+ | ????稻獎?B | ||
+ | 4a:49:53:1b:24:42:4a:38:3b:7a:4e:73:1b:28:42: | ||
+ | JIS文字列 | ||
+ | 4a:49:53:95:b6:8e:9a:97:f1: | ||
+ | |||
+ | </syntaxhighlight> | ||
+ | のようなものが得られます。 | ||
+ | |||
+ | |||
+ | これですべての変換が出来そうな気分ですが、実際にはshift_jisコード上で展開される携帯電話各社の絵文字があったり、UNICODE上での文字の重複による変換先の最適化、UNICODEにしかない文字の変換があった場合の処理など実際のプログラミング技術が、ここをスタート地点として、広がっています。auとDocomoは絵文字を統一させたんだったかも…ソフトバンクはかなり独自の体系を維持。ウィルコム。イーモバ…ふむ、どうなってるんだろ。んで、UNICODEにも少し絵文字が追加されてたり…。でも結局、それを表示するのはその文字コードのグリフをもったフォントファイルなわけです。やれる範囲。結構、限られてます。特殊文字には、年号とかもあります。次の年号の文字コードとかも、後で変更追加になるに違いない。㍻。←平成を一文字で表した環境依存文字。文字コードの世界が今のようになった歴史を知るのも面白いですし、これからの文字コードはどうあるべきかを議論する国際的なワーキンググループも活動しています。絶賛迷走中あるいは理想形へ向かって進行中です。メールで半角カタカナが使えないのはJISコード iso-2022-jpのおかげです。 | ||
+ | |||
+ | |||
+ | 上記のサンプルですが、動作しますが、ucnv_openでエラーコードが返ってきています。-122だそうで調べてみるとAMBIGUOUS_ALIAS_WARNING(-122) This converter alias can go to different converter implementations.とのことです。ワーニングレベルと認識できますが、他の方法で実装できるよだって。どういうこと? | ||
=='''文字列大文字小文字変換'''== | =='''文字列大文字小文字変換'''== |