新生鳩丸掲示板♯

bakera.jp > 新生鳩丸掲示板♯ > [4786] Re: 「Unicodeエスケープのサロゲート対応版」

記事個別表示 (4786)

[4786] Re: 「Unicodeエスケープのサロゲート対応版」

ばけら (2008年1月29日 1時1分)

>kconv は中身の nkf が U+301C と U+FF5E の正規化を行ったりするので、このような用途だと望ましくないです。

 あ、なるほど、それは気づきませんでした……。

 ありがとうございます。

>ていうか、元が UTF-8 なら unpack の U* を使えばはやいでしょう。

 0xFFFF 以上の文字をサロゲートペアに変換する処理が必要なのですが、それが面倒でして。

 割とすぐ書けそうな気もするのですが、Ruby にもサロゲートにも慣れていないもので、あまり考えずに UTF-16 に変換したかったという……。

コメントフォーム

※広告や宣伝の書き込みはご遠慮ください。

:

:

:

最近の日記

関わった本など