文字参照とエンコードとエスケープ
2007年4月11日(水曜日)
文字参照とエンコードとエスケープ
「対策遅らせるHTMLエンコーディングの「神話」 (itpro.nikkeibp.co.jp)」。……徳丸さんの記事第二弾。
注1)実体参照(entity reference)というのが正式だが,あまり普及していない用語なので,HTMLエンコードという用語を用いる
(~中略~)
HTMLエンコードというのは,例えば「&」「<」「>」「"」といった,HTMLとして特殊な意味を持つ文字(特殊文字またはメタ文字)を,意味を持たない別の文字列に置換することである。
この注釈はいらないでしょう。「メタ文字を、意味を持たない別の文字列に置換すること」を実体参照とは言いません。もちろん HTML の仕様には「HTMLエンコード」などという言葉は出てきませんが、ここではサーバ側での変換処理のことを呼んでいるわけですから、無理に SGML/XML の仕様で使われている用語に置き換えようとする必要は無いはずです。
ただ、「HTMLエンコード」という言い方は、Microsoft 製品に親しみのない人には違和感があるかもしれません。ASP の Server.HtmlEncode() や .NET Framework の System.Web.HttpServerUtility.HtmlEncode() の処理がまさにこれなので、Microsoft 的には「エンコード」なのでしょうが、「エスケープ」とかいう方が一般的なような気がします。
- 「文字参照とエンコードとエスケープ」にコメントを書く
関連する話題: HTML / セキュリティ / 狙われるWebアプリケーション / ITpro
- 前(古い): 今日の心に残った一言
- 次(新しい): 地頭