記事個別表示 (2680)
これは「水無月ばけらのえび日記 : msearch におけるディレクトリトラバーサルの脆弱性」に関連するコメントです。
[2680] Re: 「msearch におけるディレクトリトラバーサルの脆弱性」
えむけい (2005年3月21日 4時35分)
なんか文字数が多すぎると怒られたので分割します。
------------------------------------------------------------
それ以外に、FAQなどを読んでいて気づいた点をいくつか。
http://www.marbacka.net/msearch/faq.html#faq0101
> unicode Unicode
> ※UTF-16LEもしくはUTF-32LE。BOM有であること。
「unicode」がUTF-32と解釈されることはありません。IEはUTF-32に対応していませんが、U+0000を無視するので、1文字おきにU+0000が入ったUTF-16のファイルとして、偶然読めているだけです。BMP超の文字を含むファイルを読ませてみれば分かります。
http://www.marbacka.net/msearch/faq.html#faq1103
> <a href="#faq1106">ActivePerlを使って作成する方法</a>
リンク先の質問がなくなっています。
http://www.marbacka.net/msearch/faq.html#faq1301
> IE6でUTF-16BE、UTF-32BEで開こうとすると文字化けすることが多いです。特にUT-32BEがひどいです。
http://www.marbacka.net/msearch/faq.html#faq1302
> UTF-16BE, 32BEのページが文字化けして表示されることがある。特にUTF-32BEがひどい。
すでに述べたとおりIEはUTF-32に対応していませんから当然ですね。むしろ中途半端に読めてしまうのが問題かもしれません。
http://www.marbacka.net/msearch/faq.html#faq2109
> UCS-4全文字(0x00000000から0x7FFFFFFFまで)を表現できるのは、UTF-8, 32LE, 32BEのみです。
UTF-32の定義域はU+10FFFFまでで、それ以上の値を含むUTF-32は不正です。
UTF-8も、UnicodeやRFCの定義ではU+10FFFFまでしか表せません。
http://www.marbacka.net/msearch/faq.html#faq2111
> 12.UCS-2とUTF-16とは何が違うの?
> まず規定している規格そのものが違います。UCS-2はISOがISO-10646仕様書で規定している文字コード体系です。 (UCSはUniversal Multiple-Octet Coded Character Setの略です。) UTF-16はUnicodeコンソーシアムが規定している文字コード体系です。
UTF-16はISO/IEC 10646の附属書でも規定されています。
http://www.marbacka.net/msearch/faq.html#faq2207
> <a href="/marbacka/msearch/test/innehall.html">テストページの一覧</a>に
リンクが切れています。
(続く)
これは「水無月ばけらのえび日記 : msearch におけるディレクトリトラバーサルの脆弱性」に関連するコメントです。
全読: [2656]Re: 「msearch におけるディレクトリトラバーサルの脆弱性」からのスレッド(12件)]