新生鳩丸掲示板♯

bakera.jp > 新生鳩丸掲示板♯ > 投稿順表示 (436/567)

投稿順表示 (436/567)

[2691] Re: SGML の短縮タグ機構

えむけい (2005年3月23日 21時40分)

>そもそもダウンロードになる条件というのをよく知らなかったので、結局text/htmlで提供してますが……。これはもうapplication/xhtml+xmlにしちゃってよいんでしょうか?

実はapplication/xhtml+xmlに対応していない著名なUAがもう1つあります。Googlebotです。

というわけで、Googleにインデックスされなくてもかまわないならいいのではないかと。

[2690] Re: SGML の短縮タグ機構

かんな (2005年3月23日 14時46分)

>AddType "application/xhtml+xml" html

以前に全く同じことをしたとき、ダウンロードが再現されなかったので、"どうしてなんだー?不思議。"とか思ってました。.xmlでもダウンロードになりませんが、文書型宣言のところでパースエラーになりますし(いろいろいじってみたのですけど、何やってもそれは解決しませんでした)。

そもそもダウンロードになる条件というのをよく知らなかったので、結局text/htmlで提供してますが……。これはもうapplication/xhtml+xmlにしちゃってよいんでしょうか?

[2689] Re: SGML の短縮タグ機構

えむけい (2005年3月23日 6時39分)

>そうでしたか、はてなシステムの不便利さでご迷惑をおかけいたしました。

いや私も知らないから質問してみたのですが。日記にコメントしたときメールか何かで何月何日の発言にコメントがつきました、とか通知されれば傍目には全く分からなくても問題ないわけです。

その様子だと来てなさげですけど、念のため日記にコメントしておくので結果をご報告ください。

><q>XML パースエラー: 整形式になっていません</q>には驚きました。試しに.htaccessで異常なことを以下のようにしてみました。

>AddType "application/xhtml+xml" html

>xがついていないのは仕様です。IEで見たのですが、効果が出なくてがっかりしました。IEの「拡張子ではなく、内容によってファイルを開く」オプションを無効にしてあったのですけれど。

マジで効果がないですね。これには私が驚きました。拡張子なしや、xhtmlだとちゃんとダウンロードになるのですが。

ということは拡張子を.htmlにすれば夢の【謎】application/xhtml+xmlでXHTML 1.1リソース提供! が実現できるわけですか。今まで誰も【誰】気付かなかったのが不思議なくらいです。

[2688] Re: SGML の短縮タグ機構

スターダスト (2005年3月22日 23時53分)

>えむけい様@[No.2678]

そうでしたか、はてなシステムの不便利さでご迷惑をおかけいたしました。亜空間。という単語を久しぶりに見ました。今後とも宜しくお願いいたします。

--

<q>XML パースエラー: 整形式になっていません</q>には驚きました。試しに.htaccessで異常なことを以下のようにしてみました。

AddType "application/xhtml+xml" html

xがついていないのは仕様です。IEで見たのですが、効果が出なくてがっかりしました。IEの「拡張子ではなく、内容によってファイルを開く」オプションを無効にしてあったのですけれど。

[2687] Re: SGML の短縮タグ機構

えむけい (2005年3月21日 19時36分)

> というか、どちらかというと誤訳っぽいのではないでしょうか。

誤訳といえば【謎】インターネットオプションの「スクリプトを実行しても安全だと(snip)ActiveX コントロールの初期化とスクリプトの実行」とか「Java アプレットのスクリプト」ってはっきり言って誤訳だと思うのです。

まるで ActiveX コントロールがスクリプトを実行しそうな感じに見えたり、アプレットのスクリプトって何ですか Groovy ですか【謎】という感じだったりしますが、実際には ActiveX コントロールや Java アプレット「を」スクリプトから操作することを認めるかどうか、という設定項目なわけで。

高木さん【誰】あたりが突っ込んでくれないかしら【謎】。

ActiveX と名の付く設定項目を全部有効にしてくださいとかスクリプトと含まれる【以下略】とかいう指示が行われがちな理由の1つに、設定項目の意味不明さがあると思います。たぶん最初に訳したマイクロソフト日本法人の中の人【誰】も意味が分かっていなかったのでしょう【謎】。

[2686] Re: ばけらのPerlメモ

ばけら (2005年3月21日 16時28分)

>とはいいつつ、RFC2822でもRFC822的なlocal-partの文法をobs-local-partとして取り込んでいるので、結局のところ使える表現は同じになります。当然正規表現も同じものになるで、あらためて作る必要は無かったりします。

 RFC2822 のそれから その obs- 系を抜いたものがあると便利は便利なのかもしれません。

 作るの面倒ですけど。

[2685] Re: SGML の短縮タグ機構

ばけら (2005年3月21日 16時26分)

>あ、フォームっていうのはform要素のことではなくて、well-formedじゃないって意味なのか。ああ勘違い。

 というか、どちらかというと誤訳っぽいのではないでしょうか。

[2684] Re: 「msearch におけるディレクトリトラバーサルの脆弱性」

ばけら (2005年3月21日 16時26分)

>削除すること自体は全く問題なさげですが、いったいどのへんが問題だったのかマジでさっぱり分かりません。

 何故か懐かしさを感じますね。

 名前が NG ワード指定されていたということから素直に考えると、名前が問題だったのでしょうか。どのあたりが問題なのかはやはり全く分かりませんが。

[2683] Re: SGML の短縮タグ機構

かんな (2005年3月21日 16時0分)

>……って、どこにフォームがあるのか識者【誰】に教えてもらいたいところです。

あ、フォームっていうのはform要素のことではなくて、well-formedじゃないって意味なのか。ああ勘違い。

[2682] Re: SGML の短縮タグ機構

かんな (2005年3月21日 10時12分)

>Operaに関しては識者【誰】の報告を待ちます。

識者なのでしょうか。こんな感じのエラー出ました。

"XML の解析に失敗しました: フォームが不正です (行: 1, 文字: 44)"

……って、どこにフォームがあるのか識者【誰】に教えてもらいたいところです。

[2681] Re: 「msearch におけるディレクトリトラバーサルの脆弱性」

えむけい (2005年3月21日 4時37分)

続き。

------------------------------------------------------------

http://www.marbacka.net/msearch/faq.html#faq2305

> ただしUnicode外の文字(ISO10646のUCS-4では規定されているもののUnicode領域を超えている文字)は扱えません。

JIS X 0213にそんな文字はありませんが…。なぜこの文がここに書かれているのか分かりませんが、削除するか「ISO/IEC 10646の文字は使えますか?」という項目を別に立てた方がいいと思います。

http://www.marbacka.net/msearch/faq.html#faq2314

> <a href="/marbacka/msearch/test/innehall.html">テストページの一覧</a>に

リンクが切れています。それにテストページへのリンクがなぜかコメントアウトされているようですが…。

http://www.marbacka.net/msearch/faq2.html#faq2002

> ※2:JIS2000で規定されている漢字はほとんどが(Version 4.0以降の)Unicodeに収録されています。ただし100%すべて収録されているかどうかはわかりません。

すべて収録されています。また2004年に改訂されたので現在はJIS2000という名称は用いない方がいいでしょう。

------------------------------------------------------------

> 管理人が著しく不利益もしくは不愉快と判断する記事、社会性のない文章・記事、他人を誹謗中傷する記事、公序良俗に反する記事などは予告なく削除します。

とか書かれてたので削除すること自体は全く問題なさげですが、いったいどのへんが問題だったのかマジでさっぱり分かりません。

[2680] Re: 「msearch におけるディレクトリトラバーサルの脆弱性」

えむけい (2005年3月21日 4時35分)

なんか文字数が多すぎると怒られたので分割します。

------------------------------------------------------------

それ以外に、FAQなどを読んでいて気づいた点をいくつか。

http://www.marbacka.net/msearch/faq.html#faq0101

> unicode    Unicode

> ※UTF-16LEもしくはUTF-32LE。BOM有であること。

「unicode」がUTF-32と解釈されることはありません。IEはUTF-32に対応していませんが、U+0000を無視するので、1文字おきにU+0000が入ったUTF-16のファイルとして、偶然読めているだけです。BMP超の文字を含むファイルを読ませてみれば分かります。

http://www.marbacka.net/msearch/faq.html#faq1103

> <a href="#faq1106">ActivePerlを使って作成する方法</a>

リンク先の質問がなくなっています。

http://www.marbacka.net/msearch/faq.html#faq1301

> IE6でUTF-16BE、UTF-32BEで開こうとすると文字化けすることが多いです。特にUT-32BEがひどいです。

http://www.marbacka.net/msearch/faq.html#faq1302

> UTF-16BE, 32BEのページが文字化けして表示されることがある。特にUTF-32BEがひどい。

すでに述べたとおりIEはUTF-32に対応していませんから当然ですね。むしろ中途半端に読めてしまうのが問題かもしれません。

http://www.marbacka.net/msearch/faq.html#faq2109

> UCS-4全文字(0x00000000から0x7FFFFFFFまで)を表現できるのは、UTF-8, 32LE, 32BEのみです。

UTF-32の定義域はU+10FFFFまでで、それ以上の値を含むUTF-32は不正です。

UTF-8も、UnicodeやRFCの定義ではU+10FFFFまでしか表せません。

http://www.marbacka.net/msearch/faq.html#faq2111

> 12.UCS-2とUTF-16とは何が違うの?

> まず規定している規格そのものが違います。UCS-2はISOがISO-10646仕様書で規定している文字コード体系です。 (UCSはUniversal Multiple-Octet Coded Character Setの略です。) UTF-16はUnicodeコンソーシアムが規定している文字コード体系です。

UTF-16はISO/IEC 10646の附属書でも規定されています。

http://www.marbacka.net/msearch/faq.html#faq2207

> <a href="/marbacka/msearch/test/innehall.html">テストページの一覧</a>に

リンクが切れています。

(続く)

[2679] Re: 「msearch におけるディレクトリトラバーサルの脆弱性」

えむけい (2005年3月21日 4時34分)

>脆弱性とは関係ありませんが、Unicode版msearchのページのUTF-16に関する説明が凄いですね。あまりに凄すぎるので思わず掲示板で突っ込んでしまいました【謎】。

なんか無言で削除された上にご利用をご遠慮されてしまったので(名前がNGワードになっていた)、削除された内容をこっちに貼り付けておきます。といっても(まさかこんな物凄い対応をされるとは夢にも思いませんでしたし)書き込んだ内容は保存していなかったので、正確に前回投稿した内容と同じではありませんけど。

------------------------------------------------------------

UTF-16BE, 16LE, 32BE, 32LEはBOMを付けることが禁止されている文字エンコーディングです。BOMがある場合にはUTF-16, UTF-32というcharset名にしなくてはなりません。

http://www.ietf.org/rfc/rfc2781.txt

|Systems labelling UTF-16BE text MUST NOT prepend a BOM to the text.

|Systems labelling UTF-16LE text MUST NOT prepend a BOM to the text.

|MUST label the text as "UTF-16", and SHOULD make sure the text starts with 0xFEFF.

Unicode版msearchはUTF-16, UTF-32の場合BOMがあることを前提にしているようですから、UTF-16BE, 16LE, 32BE, 32LEには「対応していない」というのが正解です。

ページ中のUTF-16LE, 16BEと書かれている箇所はUTF-16に、UTF-32BE, 32LEと書かれている場所はUTF-32に、すべて置き換える必要があります。

トップページ「2. 文字コードの指定」を鵜呑みにしてmetaタグのcharset指定にUTF-16BE, 16LE, 32BE, 32LEを入れてしまった人がいるかもしれませんから、何らかの手段で告知した方がいいかもしれません。

どうしてもbig endian、little endianを区別する必要がある場合(たとえばテストページの

http://www.marbacka.net/msearch/test/innehall.html

> 日本語のサンプル文章(XHTML, UTF-16LE)

> 日本語のサンプル文章(XHTML, UTF-16BE)

> 日本語のサンプル文章(XHTML, UTF-32LE)

> 日本語のサンプル文章(XHTML, UTF-32BE)

という部分)は、

> 日本語のサンプル文章(XHTML, UTF-16, litle-endian)

> 日本語のサンプル文章(XHTML, UTF-16, big-endian)

> 日本語のサンプル文章(XHTML, UTF-32, litle-endian)

> 日本語のサンプル文章(XHTML, UTF-32, big-endian)

のように書くしかありません。UTF-16LE, 16BE, 32LE, 32BEと書くとBOMなしという意味になるため、本当にBOMが無い場合以外書いてはいけません。

(続く)

[2678] Re: SGML の短縮タグ機構

えむけい (2005年3月21日 2時35分)

>>FirefoxやOperaにapplication/xhtml+xmlで喰わせてやっても解釈するでしょうか。

>これは体験してみたいです。私の技量は極めて貧相ですので実現方法はまったく不明なのですが。不明なのは私のドタマですけれども。

こちらで試してみたところ、Firefoxではこんな感じでしっかりエラーになりました。

|XML パースエラー: 整形式になっていません URL: (snip)/shorttagc.xhtml 行番号: 9, 列番号: 45:<script type='text/javascript' src='./ex.js'</script

Operaに関しては識者【誰】の報告を待ちます。

>できましたら今後とも間違いがございましたらご指摘願います。当日記のコメント欄ででもかまいません。よろしくお願いいたします。

はてなダイアリーのシステムはよく知らないのですが、古い日記にコメントしても確実に日記の管理者にコメントが伝わるようになっているのでしょうか。日記トップにRecent Commentsもありませんし、そのへんにイマイチ自身を持てなかったのでここ【何処】で亜空間レスしてみたわけですが。

[2677] Re: SGML の短縮タグ機構

スターダスト (2005年3月19日 12時26分)

えむけいさん、ご指摘をありがとうございます。

>> こんなのイヤなのでブラウザは文法違反はどんどん取りしまって無視して欲しいです。

>文法違反ではないので文法違反を取り締まっても無駄だと思います。

くだんの記述は訂正をいれます。ありがとうございました。

>むしろtagcの省略を解釈できない手抜きサニタイザーが文法違反でしょう【謎】。

おっしゃられるとおりです。

>ってもしかしてXHTMLというオチですか。

XMLならtagcの省略は行えない、というご指摘でしょうか。オチを書くつもりはありませんでした。むしろ私の書いたものがオチています。腐っているという奴ですね。

>FirefoxやOperaにapplication/xhtml+xmlで喰わせてやっても解釈するでしょうか。

これは体験してみたいです。私の技量は極めて貧相ですので実現方法はまったく不明なのですが。不明なのは私のドタマですけれども。

ありがとうございました。

できましたら今後とも間違いがございましたらご指摘願います。当日記のコメント欄ででもかまいません。よろしくお願いいたします。

[2676] Re: SGML の短縮タグ機構

えむけい (2005年3月19日 2時40分)

そこ【何処】をご覧になったのならもうお分かりだと思いますが、

http://d.hatena.ne.jp/hoshikuzu/20050310#D20050310UGOKUNAYO

> こんなのイヤなのでブラウザは文法違反はどんどん取りしまって無視して欲しいです。

文法違反ではないので文法違反を取り締まっても無駄だと思います。

http://altba.com/bakera/hatomaru.aspx/yomoyama/shorttag#section2-2

むしろtagcの省略を解釈できない手抜きサニタイザーが文法違反でしょう【謎】。

ってもしかしてXHTMLというオチですか。FirefoxやOperaにapplication/xhtml+xmlで喰わせてやっても解釈するでしょうか。

[2675] Re: SGML の短縮タグ機構

スターダスト (2005年3月18日 23時6分)

ちょっと実験をしました。

---- a.html ----

<input checked="checked">

<table border>

----------------

上のようなファイルをIE6SP1 on WindowsXP with SP2 で開き

いったん12345を入力後に

以下のブックマークレットを起動し、クリップボードに出力された

ものを見てみました。

javascript:(function (){var d=document;var t=d.createElement('TEXTAREA');t.appendChild(d.createTextNode(d.documentElement.outerHTML));var r = t.createTextRange();r.execCommand('copy');})();

クリップボードに出力されたものは以下の通りです。

---- clipboard ----

<HTML><HEAD></HEAD>

<BODY><INPUT CHECKED value=12345>

<TABLE border=1>

<TBODY></TBODY></TABLE></BODY></HTML>

-------------------

<TABLE border=1>になるなんて反則かもしれません。

checked="checked" を嫌っているようです。

[2674] Re: ばけらのPerlメモ

えむけい (2005年3月18日 23時0分)

>URIの仕様が更新されてましたけど、その影響とかないですか?

mailto: URLの仕様は思いっ切り影響を受けてますけどメールアドレスの正規表現そのものは関係なさげ。

[2673] Re: 用語「アスキーアート」

pigbaka (2005年3月18日 21時56分)

           __

         〃 _`^\__

     ,,-=-、、l{,_'´..._ `ヽs.、       / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄

   〃. ',.´二W´- ‐-`\ \ヽ、     | 

   _{l,'.'´      、 ヽ ヽ ヽ彡k、ヽ  .| 2チャンネルはじめ日本語掲示板はすべて

  .//`/   i l.    \ 、ヽ `、 i彡}ヽ`'.. | JIS文字アートと呼べというのは沖縄のキチガイ大城だけ

. /| / i {  |l {\ {ヽ、_!..ヽ」_/} .}./ |__〉.. |  bigbakaは精神異常者だから気をつけて。

 \l.{. l.ヾ _.ゝ_土. ゝ -'fT;;ヽ,| lテ}| ||__. | AAは日本語掲示板へは掲載出来ないというのはアホ独自

   /iヽゝヽ/{~);;:l    {,:..))''ノ'ノノ|{ノ |_!  | の妄想でAAは掲示板に掲載可能です。

  .|_|l」ヽ. ヽ ゞ‐'   、   ̄`ノレヽソ|.   | キチガイのbigbaka大城に騙されないで。

     (.ソ.ゝ     --    /' {=}ノ.   < こいつは正真正銘の精神異常者です。。

     (=| l へ、      /ノノ((s.)),.  |  つまりbigbakaはキチガイだから相手にしないこと。

     ((!)ヾヽヽ` ;.- ' ´ |'' ''"'´.\..    | 

      \ `~^``/'l    ゜>\_ ..     \____________

     , -‐〃"´ |___/   >- 、

   / ./〃    |=/    〃/  \

  /   | ||, ‐-、_,...!、/_ ,..、 .〃/      ヽ

  〈   / -ー.{ { {.=  ヽ、|| l      |

  |   ヽ  /| |\   / i 〉        |

  〈  ∧ l_/./ |  | \ _/  /       /  

2ちゃんねるはじめ掲示板の文字絵(text art)はアスキーアート(AA)という。、2ちゃん

ねるはじめ日本語掲示板の文字絵(text art)は

アメリカのアスキーアート(AA)が掲載出来る掲示板へは日本語の文字絵(text art)は

掲載出来ないというのはキチガイのbigbaka大城だけなのだ。 アスキーアートとは

http://e-words.jp/w/ASCIIE382A2E383BCE38388.html

文字を組み合わせて作成した絵のこと。

[2672] Re: ばけらのPerlメモ

かんな (2005年3月18日 13時28分)

あ、そうなんですか。両者比べてみてかなり違ってるんじゃないかなーと最初は思ってましたけど、そうでもないですね。

URIの仕様が更新されてましたけど、その影響とかないですか?以前あるURLの表現が可能になったみたいな話出てましたけど(スレが出てこない……)、そうなるとURLの正規表現は書き換える必要があるのかもって思ったりしたんですが。

最近の日記

関わった本など