新生鳩丸掲示板♯

bakera.jp > 新生鳩丸掲示板♯ > スレッド内全記事表示 (記事 4785 からのスレッド)

スレッド内全記事表示 (記事 4785 からのスレッド)

[4785] Re: 「Unicodeエスケープのサロゲート対応版」

成瀬 (2008年1月28日 20時34分)

kconv は中身の nkf が U+301C と U+FF5E の正規化を行ったりするので、このような用途だと望ましくないです。

ていうか、元が UTF-8 なら unpack の U* を使えばはやいでしょう。

[4786] Re: 「Unicodeエスケープのサロゲート対応版」

ばけら (2008年1月29日 1時1分)

>kconv は中身の nkf が U+301C と U+FF5E の正規化を行ったりするので、このような用途だと望ましくないです。

 あ、なるほど、それは気づきませんでした……。

 ありがとうございます。

>ていうか、元が UTF-8 なら unpack の U* を使えばはやいでしょう。

 0xFFFF 以上の文字をサロゲートペアに変換する処理が必要なのですが、それが面倒でして。

 割とすぐ書けそうな気もするのですが、Ruby にもサロゲートにも慣れていないもので、あまり考えずに UTF-16 に変換したかったという……。

最近の日記

関わった本など