「Unicodeエスケープのサロゲート対応版」へのコメント
「水無月ばけらのえび日記 : Unicodeエスケープのサロゲート対応版」について、2件のコメントが書かれています。
[4785] Re: 「Unicodeエスケープのサロゲート対応版」
成瀬 (2008年1月28日 20時34分)
kconv は中身の nkf が U+301C と U+FF5E の正規化を行ったりするので、このような用途だと望ましくないです。
ていうか、元が UTF-8 なら unpack の U* を使えばはやいでしょう。
[4786] Re: 「Unicodeエスケープのサロゲート対応版」
ばけら (2008年1月29日 1時1分)
>kconv は中身の nkf が U+301C と U+FF5E の正規化を行ったりするので、このような用途だと望ましくないです。
あ、なるほど、それは気づきませんでした……。
ありがとうございます。
>ていうか、元が UTF-8 なら unpack の U* を使えばはやいでしょう。
0xFFFF 以上の文字をサロゲートペアに変換する処理が必要なのですが、それが面倒でして。
割とすぐ書けそうな気もするのですが、Ruby にもサロゲートにも慣れていないもので、あまり考えずに UTF-16 に変換したかったという……。
「水無月ばけらのえび日記 : Unicodeエスケープのサロゲート対応版」についてコメントを書く場合は、以下のフォームに記入してください。