新生鳩丸掲示板♯

bakera.jp > 新生鳩丸掲示板♯ > 投稿順表示 (151/282)

投稿順表示 (151/282)

[2681] Re: 「msearch におけるディレクトリトラバーサルの脆弱性」

えむけい (2005年3月21日 4時37分)

続き。

------------------------------------------------------------

http://www.marbacka.net/msearch/faq.html#faq2305

> ただしUnicode外の文字(ISO10646のUCS-4では規定されているもののUnicode領域を超えている文字)は扱えません。

JIS X 0213にそんな文字はありませんが…。なぜこの文がここに書かれているのか分かりませんが、削除するか「ISO/IEC 10646の文字は使えますか?」という項目を別に立てた方がいいと思います。

http://www.marbacka.net/msearch/faq.html#faq2314

> <a href="/marbacka/msearch/test/innehall.html">テストページの一覧</a>に

リンクが切れています。それにテストページへのリンクがなぜかコメントアウトされているようですが…。

http://www.marbacka.net/msearch/faq2.html#faq2002

> ※2:JIS2000で規定されている漢字はほとんどが(Version 4.0以降の)Unicodeに収録されています。ただし100%すべて収録されているかどうかはわかりません。

すべて収録されています。また2004年に改訂されたので現在はJIS2000という名称は用いない方がいいでしょう。

------------------------------------------------------------

> 管理人が著しく不利益もしくは不愉快と判断する記事、社会性のない文章・記事、他人を誹謗中傷する記事、公序良俗に反する記事などは予告なく削除します。

とか書かれてたので削除すること自体は全く問題なさげですが、いったいどのへんが問題だったのかマジでさっぱり分かりません。

[2680] Re: 「msearch におけるディレクトリトラバーサルの脆弱性」

えむけい (2005年3月21日 4時35分)

なんか文字数が多すぎると怒られたので分割します。

------------------------------------------------------------

それ以外に、FAQなどを読んでいて気づいた点をいくつか。

http://www.marbacka.net/msearch/faq.html#faq0101

> unicode    Unicode

> ※UTF-16LEもしくはUTF-32LE。BOM有であること。

「unicode」がUTF-32と解釈されることはありません。IEはUTF-32に対応していませんが、U+0000を無視するので、1文字おきにU+0000が入ったUTF-16のファイルとして、偶然読めているだけです。BMP超の文字を含むファイルを読ませてみれば分かります。

http://www.marbacka.net/msearch/faq.html#faq1103

> <a href="#faq1106">ActivePerlを使って作成する方法</a>

リンク先の質問がなくなっています。

http://www.marbacka.net/msearch/faq.html#faq1301

> IE6でUTF-16BE、UTF-32BEで開こうとすると文字化けすることが多いです。特にUT-32BEがひどいです。

http://www.marbacka.net/msearch/faq.html#faq1302

> UTF-16BE, 32BEのページが文字化けして表示されることがある。特にUTF-32BEがひどい。

すでに述べたとおりIEはUTF-32に対応していませんから当然ですね。むしろ中途半端に読めてしまうのが問題かもしれません。

http://www.marbacka.net/msearch/faq.html#faq2109

> UCS-4全文字(0x00000000から0x7FFFFFFFまで)を表現できるのは、UTF-8, 32LE, 32BEのみです。

UTF-32の定義域はU+10FFFFまでで、それ以上の値を含むUTF-32は不正です。

UTF-8も、UnicodeやRFCの定義ではU+10FFFFまでしか表せません。

http://www.marbacka.net/msearch/faq.html#faq2111

> 12.UCS-2とUTF-16とは何が違うの?

> まず規定している規格そのものが違います。UCS-2はISOがISO-10646仕様書で規定している文字コード体系です。 (UCSはUniversal Multiple-Octet Coded Character Setの略です。) UTF-16はUnicodeコンソーシアムが規定している文字コード体系です。

UTF-16はISO/IEC 10646の附属書でも規定されています。

http://www.marbacka.net/msearch/faq.html#faq2207

> <a href="/marbacka/msearch/test/innehall.html">テストページの一覧</a>に

リンクが切れています。

(続く)

[2679] Re: 「msearch におけるディレクトリトラバーサルの脆弱性」

えむけい (2005年3月21日 4時34分)

>脆弱性とは関係ありませんが、Unicode版msearchのページのUTF-16に関する説明が凄いですね。あまりに凄すぎるので思わず掲示板で突っ込んでしまいました【謎】。

なんか無言で削除された上にご利用をご遠慮されてしまったので(名前がNGワードになっていた)、削除された内容をこっちに貼り付けておきます。といっても(まさかこんな物凄い対応をされるとは夢にも思いませんでしたし)書き込んだ内容は保存していなかったので、正確に前回投稿した内容と同じではありませんけど。

------------------------------------------------------------

UTF-16BE, 16LE, 32BE, 32LEはBOMを付けることが禁止されている文字エンコーディングです。BOMがある場合にはUTF-16, UTF-32というcharset名にしなくてはなりません。

http://www.ietf.org/rfc/rfc2781.txt

|Systems labelling UTF-16BE text MUST NOT prepend a BOM to the text.

|Systems labelling UTF-16LE text MUST NOT prepend a BOM to the text.

|MUST label the text as "UTF-16", and SHOULD make sure the text starts with 0xFEFF.

Unicode版msearchはUTF-16, UTF-32の場合BOMがあることを前提にしているようですから、UTF-16BE, 16LE, 32BE, 32LEには「対応していない」というのが正解です。

ページ中のUTF-16LE, 16BEと書かれている箇所はUTF-16に、UTF-32BE, 32LEと書かれている場所はUTF-32に、すべて置き換える必要があります。

トップページ「2. 文字コードの指定」を鵜呑みにしてmetaタグのcharset指定にUTF-16BE, 16LE, 32BE, 32LEを入れてしまった人がいるかもしれませんから、何らかの手段で告知した方がいいかもしれません。

どうしてもbig endian、little endianを区別する必要がある場合(たとえばテストページの

http://www.marbacka.net/msearch/test/innehall.html

> 日本語のサンプル文章(XHTML, UTF-16LE)

> 日本語のサンプル文章(XHTML, UTF-16BE)

> 日本語のサンプル文章(XHTML, UTF-32LE)

> 日本語のサンプル文章(XHTML, UTF-32BE)

という部分)は、

> 日本語のサンプル文章(XHTML, UTF-16, litle-endian)

> 日本語のサンプル文章(XHTML, UTF-16, big-endian)

> 日本語のサンプル文章(XHTML, UTF-32, litle-endian)

> 日本語のサンプル文章(XHTML, UTF-32, big-endian)

のように書くしかありません。UTF-16LE, 16BE, 32LE, 32BEと書くとBOMなしという意味になるため、本当にBOMが無い場合以外書いてはいけません。

(続く)

[2678] Re: SGML の短縮タグ機構

えむけい (2005年3月21日 2時35分)

>>FirefoxやOperaにapplication/xhtml+xmlで喰わせてやっても解釈するでしょうか。

>これは体験してみたいです。私の技量は極めて貧相ですので実現方法はまったく不明なのですが。不明なのは私のドタマですけれども。

こちらで試してみたところ、Firefoxではこんな感じでしっかりエラーになりました。

|XML パースエラー: 整形式になっていません URL: (snip)/shorttagc.xhtml 行番号: 9, 列番号: 45:<script type='text/javascript' src='./ex.js'</script

Operaに関しては識者【誰】の報告を待ちます。

>できましたら今後とも間違いがございましたらご指摘願います。当日記のコメント欄ででもかまいません。よろしくお願いいたします。

はてなダイアリーのシステムはよく知らないのですが、古い日記にコメントしても確実に日記の管理者にコメントが伝わるようになっているのでしょうか。日記トップにRecent Commentsもありませんし、そのへんにイマイチ自身を持てなかったのでここ【何処】で亜空間レスしてみたわけですが。

[2677] Re: SGML の短縮タグ機構

スターダスト (2005年3月19日 12時26分)

えむけいさん、ご指摘をありがとうございます。

>> こんなのイヤなのでブラウザは文法違反はどんどん取りしまって無視して欲しいです。

>文法違反ではないので文法違反を取り締まっても無駄だと思います。

くだんの記述は訂正をいれます。ありがとうございました。

>むしろtagcの省略を解釈できない手抜きサニタイザーが文法違反でしょう【謎】。

おっしゃられるとおりです。

>ってもしかしてXHTMLというオチですか。

XMLならtagcの省略は行えない、というご指摘でしょうか。オチを書くつもりはありませんでした。むしろ私の書いたものがオチています。腐っているという奴ですね。

>FirefoxやOperaにapplication/xhtml+xmlで喰わせてやっても解釈するでしょうか。

これは体験してみたいです。私の技量は極めて貧相ですので実現方法はまったく不明なのですが。不明なのは私のドタマですけれども。

ありがとうございました。

できましたら今後とも間違いがございましたらご指摘願います。当日記のコメント欄ででもかまいません。よろしくお願いいたします。

[2676] Re: SGML の短縮タグ機構

えむけい (2005年3月19日 2時40分)

そこ【何処】をご覧になったのならもうお分かりだと思いますが、

http://d.hatena.ne.jp/hoshikuzu/20050310#D20050310UGOKUNAYO

> こんなのイヤなのでブラウザは文法違反はどんどん取りしまって無視して欲しいです。

文法違反ではないので文法違反を取り締まっても無駄だと思います。

http://altba.com/bakera/hatomaru.aspx/yomoyama/shorttag#section2-2

むしろtagcの省略を解釈できない手抜きサニタイザーが文法違反でしょう【謎】。

ってもしかしてXHTMLというオチですか。FirefoxやOperaにapplication/xhtml+xmlで喰わせてやっても解釈するでしょうか。

[2675] Re: SGML の短縮タグ機構

スターダスト (2005年3月18日 23時6分)

ちょっと実験をしました。

---- a.html ----

<input checked="checked">

<table border>

----------------

上のようなファイルをIE6SP1 on WindowsXP with SP2 で開き

いったん12345を入力後に

以下のブックマークレットを起動し、クリップボードに出力された

ものを見てみました。

javascript:(function (){var d=document;var t=d.createElement('TEXTAREA');t.appendChild(d.createTextNode(d.documentElement.outerHTML));var r = t.createTextRange();r.execCommand('copy');})();

クリップボードに出力されたものは以下の通りです。

---- clipboard ----

<HTML><HEAD></HEAD>

<BODY><INPUT CHECKED value=12345>

<TABLE border=1>

<TBODY></TBODY></TABLE></BODY></HTML>

-------------------

<TABLE border=1>になるなんて反則かもしれません。

checked="checked" を嫌っているようです。

[2674] Re: ばけらのPerlメモ

えむけい (2005年3月18日 23時0分)

>URIの仕様が更新されてましたけど、その影響とかないですか?

mailto: URLの仕様は思いっ切り影響を受けてますけどメールアドレスの正規表現そのものは関係なさげ。

[2673] Re: 用語「アスキーアート」

pigbaka (2005年3月18日 21時56分)

           __

         〃 _`^\__

     ,,-=-、、l{,_'´..._ `ヽs.、       / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

   〃. ',.´二W´- ‐-`\ \ヽ、     | 

   _{l,'.'´      、 ヽ ヽ ヽ彡k、ヽ  .| 2チャンネルはじめ日本語掲示板はすべて

  .//`/   i l.    \ 、ヽ `、 i彡}ヽ`'.. | JIS文字アートと呼べというのは沖縄のキチガイ大城だけ

. /| / i {  |l {\ {ヽ、_!..ヽ」_/} .}./ |__〉.. |  bigbakaは精神異常者だから気をつけて。

 \l.{. l.ヾ _.ゝ_土. ゝ -'fT;;ヽ,| lテ}| ||__. | AAは日本語掲示板へは掲載出来ないというのはアホ独自

   /iヽゝヽ/{~);;:l    {,:..))''ノ'ノノ|{ノ |_!  | の妄想でAAは掲示板に掲載可能です。

  .|_|l」ヽ. ヽ ゞ‐'   、   ̄`ノレヽソ|.   | キチガイのbigbaka大城に騙されないで。

     (.ソ.ゝ     --    /' {=}ノ.   < こいつは正真正銘の精神異常者です。。

     (=| l へ、      /ノノ((s.)),.  |  つまりbigbakaはキチガイだから相手にしないこと。

     ((!)ヾヽヽ` ;.- ' ´ |'' ''"'´.\..    | 

      \ `~^``/'l    ゜>\_ ..     \____________

     , -‐〃"´ |___/   >- 、

   / ./〃    |=/    〃/  \

  /   | ||, ‐-、_,...!、/_ ,..、 .〃/      ヽ

  〈   / -ー.{ { {.=  ヽ、|| l      |

  |   ヽ  /| |\   / i 〉        |

  〈  ∧ l_/./ |  | \ _/  /       /  

2ちゃんねるはじめ掲示板の文字絵(text art)はアスキーアート(AA)という。、2ちゃん

ねるはじめ日本語掲示板の文字絵(text art)は

アメリカのアスキーアート(AA)が掲載出来る掲示板へは日本語の文字絵(text art)は

掲載出来ないというのはキチガイのbigbaka大城だけなのだ。 アスキーアートとは

http://e-words.jp/w/ASCIIE382A2E383BCE38388.html

文字を組み合わせて作成した絵のこと。

[2672] Re: ばけらのPerlメモ

かんな (2005年3月18日 13時28分)

あ、そうなんですか。両者比べてみてかなり違ってるんじゃないかなーと最初は思ってましたけど、そうでもないですね。

URIの仕様が更新されてましたけど、その影響とかないですか?以前あるURLの表現が可能になったみたいな話出てましたけど(スレが出てこない……)、そうなるとURLの正規表現は書き換える必要があるのかもって思ったりしたんですが。

[2671] Re: DOCTYPE宣言

ばけら (2005年3月18日 13時4分)

>HTMLやXHTMLではhtmlやheadよりもDOCTYPE宣言の方が重要なのでしょうか?

 質問の意味がいまひとつ分かりませんが……。

 全ての HTML 文書には文書方宣言も html要素も head要素も必要で、これらは必須です。いずれかが欠ければ HTML 文書として不正です。

 しかし HTML4 では html要素や head要素の開始タグや終了タグは省略可能になっているため、これらのタグを省略しても問題ありません。タグが省略されている場合であっても、それは勝手に補われて html要素や head要素が存在するものとして扱われます。

[2670] Re: DOCTYPE宣言

アキト (2005年3月18日 4時41分)

お返事ありがとうございます。

HTMLやXHTMLではhtmlやheadよりもDOCTYPE宣言の方が重要なのでしょうか?

[2669] Re: 用語「アスキーアート」

遅れて来たブラックジヤック (2005年3月18日 3時36分)

アスキーアート(ascii art←USA original art)AAとJISアート(Japan original art)JOAの違い↓

http://www1.ryucom.ne.jp/papa/asciiart.htm

           __

         〃 _`^\__          / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

     ,,-=-、、l{,_'´..._ `ヽs.、       | みなさん、嘘の情報を垂れ流すことは犯罪ですよ

   〃. ',.´二W´- ‐-`\ \ヽ、     | 私JISアート(shift-JIS)のあやの、中学3年生です

   _{l,'.'´      、 ヽ ヽ ヽ彡k、ヽ  .| 2チャンネルはじめ日本語掲示板は JIS規格文字

  .//`/   i l.    \ 、ヽ `、 i彡}ヽ`'.. | JIS文字アートであり、、、アスキーアート(AA)は

. /| / i {  |l {\ {ヽ、_!..ヽ」_/} .}./ |__〉.. |  英語圏のアスキー文字絵のことで、アスキー文字

 \l.{. l.ヾ _.ゝ_土. ゝ -'fT;;ヽ,| lテ}| ||__. | 絵(AA)は日本語掲示板へは掲載出来ません。

   /iヽゝヽ/{~);;:l    {,:..))''ノ'ノノ|{ノ |_!  | なぜ掲載出来ないかと言うと、AAはアスキー 文字

  .|_|l」ヽ. ヽ ゞ‐'   、   ̄`ノレヽソ|.   | で描いた文字絵のことであり、日本語掲示板 は

     (.ソ.ゝ     --    /' {=}ノ.   < 強制的にすべての文字をJIS文字に変換します

     (=| l へ、      /ノノ((s.)),.  |  つまり 私達が見て居る文字絵はアスキーアート

     ((!)ヾヽヽ` ;.- ' ´ |'' ''"'´.\..    | (AA)ではなくJISアート(JOA)ですよ、あやのより。

      \ `~^``/'l    ゜>\_ ..     \____________

     , -‐〃"´ |___/   >- 、

   / ./〃    |=/    〃/  \

  /   | ||, ‐-、_,...!、/_ ,..、 .〃/      ヽ

  〈   / -ー.{ {\ {.=  ヽ、|| l      |

  |   ヽ  /| |\   / i 〉        |

  〈  ∧ l_/./ |  | \ _/  /       /

[2668] Re: ばけらのPerlメモ

りゅう (2005年3月17日 23時58分)

>というか私が聞きたいのは、RFC2822に対応したaddr-specの正規表現って誰か書いていませんか?

RFC2822のaddr-specは、RFC822にある仕様の穴っぽい表現ができなくなっただけで、RFC822とほぼ同じです。

たとえばRFC822では aaa."@@@".ccc@example.com ということができましたが、RFC2822的には "aaa.@@@.bbb"@example.com と書かなければなりません。

あとRFC822ではlocal-pertのドットの両側にいちいちコメントを入れられたりできちゃいますが、RFC2822ではlocal-partの前と後ろだけに入れられるようになっています。件の正規表現ではコメント系をばっさり落としているので、影響するのは前者だけになります。

とはいいつつ、RFC2822でもRFC822的なlocal-partの文法をobs-local-partとして取り込んでいるので、結局のところ使える表現は同じになります。当然正規表現も同じものになるで、あらためて作る必要は無かったりします。

[2667] 喫煙者の皆さんへ

たけ (2005年3月17日 21時2分)

日本のタバコ代は1箱270円、アメリカは州によって違うがニューヨークでは約800円です。

ヨーロッパの国でもフランスなど800円くらいの国が多いです。

要するに日本のタバコ代は安すぎます。

物価は世界一高いのに、タバコ代が極端に安すぎるのです。

タバコ代の60%は税金ですが、欧米並みにすれば500%ぐらい税金とってもいいわけです。

所得水準に比べて、あまりにもタバコ代が安いので、女子高生が制服のままマクドナルドでぷかぷかタバコをふかしています。

店員はそれを見ても何も言いません。

日本中に60万台も自販機があるので、未成年でも喫煙し放題です。

ニューヨークでは、自宅以外の屋内では喫煙できません。

レストランでタバコを吸えるところなどありません。

日本では逆に禁煙の飲食店の方が圧倒的に少なく、分煙も進んでいないため昼飯を食っている時でもオヤジが隣でタバコをふかしています。

千代田区など路上禁煙にして吸殻も以前に比べてかなり減ってきましたが、ニューヨークやロンドンなどの都市に比べると東京の街に落ちている吸殻の本数は圧倒的に多いです。

世界都市東京といいながら、街を歩けば必ずポイ捨てする人を見かけます。

タバコを吸っている人はニコチン中毒で道徳感が麻痺しているのです。

日本のタバコ規制は、甘すぎます。

人ごみで歩きタバコすれば煙や灰が飛んで目に入り痛いし、マナーを守っていると喫煙者はいいながらも隣でタバコを吸えば服や髪に臭いがついて、不快な思いをします。

「吸っていいですか」といわれても、なかなか嫌ですとはいえないですよ。

タバコの先から出る副流煙は直接吸い込む煙(主流煙)に比べてフィルターを通さない分、はるかに有害なんです。

喫煙者はこれだけ迷惑をかけながら、非常に安い税金しか払っていません。

肺ガンになって苦しむのは自業自得ですが、周りの人に迷惑をかけないでください。

本当に日本は、タバコに関する限り先進国ではありません。

ひどすぎます。

この国を少しでもよくしたい方は、禁煙してください。

[2666] Re: ばけらのPerlメモ

ばけら (2005年3月17日 11時47分)

>RFC2822ですか?大崎さんが参照しているのはRFC 822だと思いますけど。

 ぐおっ。RFC822 は obsolete と書いてあるので RFC2822 を参照しているのだと思いこんでいましたが、確認したら違いますね。むぅ。

>というか私が聞きたいのは、RFC2822に対応したaddr-specの正規表現って誰か書いていませんか?

 時間があるときに何とかしてみますか。

[2665] Re: ばけらのPerlメモ

かんな (2005年3月17日 10時26分)

>ちなみに、RFC2822 で許容されているメールアドレスのみ許可、かつ root@localhost は不可というパターンは以下のようになります。

RFC2822ですか?大崎さんが参照しているのはRFC 822だと思いますけど。

というか私が聞きたいのは、RFC2822に対応したaddr-specの正規表現って誰か書いていませんか?え、自分で書けって?……そんな難しいこと私にできるわけないじゃないですか。

[2664] Re: DOCTYPE宣言

ばけら (2005年3月16日 10時58分)

>はじめまして。

>あるサイトで

>「HTMLの基本はDOCTYPE宣言で、むしろ<html>や<head>などは省略できる」

>という事が書かれていたのですが、これはどうなんでしょう?

「基本」という意味が良く分かりませんが、HTML4 では、html要素もhead要素もbody要素も開始タグ終了タグともに省略可能です。しかし文書型宣言は省略できませんので、文書型宣言と title要素の開始タグ、終了タグしか書かれていないような HTML でも文法的には OK です。html要素などは勝手に補われて解釈されます。

 当然ですが XHTML ではそのような省略はできません。

[2663] DOCTYPE宣言

アキト (2005年3月16日 8時27分)

はじめまして。

あるサイトで

「HTMLの基本はDOCTYPE宣言で、むしろ<html>や<head>などは省略できる」

という事が書かれていたのですが、これはどうなんでしょう?

[2662] Re: 「本物サイトがクリップボードを盗もうとしている?」

えむけい (2005年3月16日 0時48分)

すみません【謎】静的ページの文言をいじる権限はないので【超謎】

最近の日記

関わった本など