水無月ばけらのえび日記

bakera.jp > 水無月ばけらのえび日記 > Unicodeエスケープのサロゲート対応版 > 「Unicodeエスケープのサロゲート対応版」へのコメント

「Unicodeエスケープのサロゲート対応版」へのコメント

[4785] Re: 「Unicodeエスケープのサロゲート対応版」

成瀬 (2008年1月28日 20時34分)

kconv は中身の nkf が U+301C と U+FF5E の正規化を行ったりするので、このような用途だと望ましくないです。

ていうか、元が UTF-8 なら unpack の U* を使えばはやいでしょう。

[4786] Re: 「Unicodeエスケープのサロゲート対応版」

ばけら (2008年1月29日 1時1分)

>kconv は中身の nkf が U+301C と U+FF5E の正規化を行ったりするので、このような用途だと望ましくないです。

 あ、なるほど、それは気づきませんでした……。

 ありがとうございます。

>ていうか、元が UTF-8 なら unpack の U* を使えばはやいでしょう。

 0xFFFF 以上の文字をサロゲートペアに変換する処理が必要なのですが、それが面倒でして。

 割とすぐ書けそうな気もするのですが、Ruby にもサロゲートにも慣れていないもので、あまり考えずに UTF-16 に変換したかったという……。

新規投稿フォーム

※広告や宣伝の書き込みはご遠慮ください。

:

:

:

最近の日記

関わった本など