Check

UTF8 -> JIS(ISO-2022-JP)変換

| | コメント(0) | トラックバック(1)

結局変換テーブル使うことに。
「機種依存字」、「正字」、「旧字」、「NEC特殊文字」、「NEC選定 IBM拡張文字」、「IBM拡張文字」、「はしご高」、「たち崎」、「つち吉」みたいなので検索して、変換の例として出ている文字を片っ端から突っ込む。

ちなみに、この辺のことを解決できそうな方法としては、iconvで「ISO-2022-JP//TRANSLIT」と指定する方法があるけど、なんか微妙にうまくいかない。
コンソールからはうまくいくのに、mojaviに組み込むとなぜかだめ。
(文字コードにかかわりそうな内部変数はいろいろいじった)
$_ENV['LANG']を見てるのはわかったけど、それだけじゃないらしい。
まあ、これも「たち崎」が変換できなかったので追っても仕方ないけど。

結局丸一日くらい悩んでる気がする。いい加減飽きたのでもういいや。

2008/07/10 「UTF8 -> JIS(ISO-2022-JP)変換(完成コード)」に完成形のコードUP

トラックバック(1)

このブログ記事を参照しているブログ一覧: UTF8 -> JIS(ISO-2022-JP)変換

このブログ記事に対するトラックバックURL: http://0-9.sakura.ne.jp/mt/mt-tb.cgi/129

結局こんな形に。 もちろん半分はパクリ。 下半分はよくある人名漢字。 2008/... 続きを読む

コメントする