鳩丸ぐろっさり (用語集)

bakera.jp > 鳩丸ぐろっさり (用語集) > UTF-8 > 「UTF-8」へのコメント

「UTF-8」へのコメント

[1289] Re: 鳩丸ぐろっさり (用語集) : 用語「UTF-8」

えむけい (2003年12月5日 14時0分)

> RFC2279 で定義されています。

> ※当初は RFC2044 でしたが、RFC2044 は RFC2279 によって破棄されました。

RFC3629が出ました。

http://www.ietf.org/rfc/rfc3629.txt

[1290] Re: 鳩丸ぐろっさり (用語集) : 用語「UTF-8」

ばけら (2003年12月5日 17時16分)

>> RFC2279 で定義されています。

>> ※当初は RFC2044 でしたが、RFC2044 は RFC2279 によって破棄されました。

>RFC3629が出ました。

>http://www.ietf.org/rfc/rfc3629.txt

 来たーっ。情報ありがとうございます。

 今ちょっと読む時間が無いので、そのうち反映します。

[1293] Re: 鳩丸ぐろっさり (用語集) : 用語「UTF-8」

ばけら (2003年12月5日 21時17分)

> 今ちょっと読む時間が無いので、そのうち反映します。

 軽く読んでみましたが、BOM の話が追加されたりしていますね。UTF-8 で BOM はどうなのよ? というのは割と FAQ だっただけにナイスかと。

 セキュリティの所にもバッファオーバーフローの話が追加されていたりしますね。

[1296] Re: 鳩丸ぐろっさり (用語集) : 用語「UTF-8」

えむけい (2003年12月6日 2時11分)

>> 今ちょっと読む時間が無いので、そのうち反映します。

> 軽く読んでみましたが、BOM の話が追加されたりしていますね。UTF-8 で BOM はどうなのよ? というのは割と FAQ だっただけにナイスかと。

> セキュリティの所にもバッファオーバーフローの話が追加されていたりしますね。

U+10FFFFを超える範囲がバッサリ削られたのも大きいと思います(HTML4やXMLではもともとあっても使えなかったわけですが)。ぐろっさりの6オクテットシーケンスまで書かれた表は修正が必要ですね。

[1414] Re: 鳩丸ぐろっさり (用語集) : 用語「UTF-8」

こお (2003年12月20日 19時49分)

お初にお邪魔いたします。

メールでどうするかのお話ですが、今や過去の遺物扱い同然のUTF-7を使うより、UTF-8とかUTF-16とかUTF-32とかで書いたものをメールソフトの段階で「Content-Transfer-Encoding: base64」なり「Content-Transfer-Encoding: quoted-printable」なりに符号化して送るほうがオーソドックスっぽいです。

[1421] Re: 鳩丸ぐろっさり (用語集) : 用語「UTF-8」

ばけら (2003年12月22日 12時3分)

>メールでどうするかのお話ですが、今や過去の遺物扱い同然のUTF-7を使うより、UTF-8とかUTF-16とかUTF-32とかで書いたものをメールソフトの段階で「Content-Transfer-Encoding: base64」なり「Content-Transfer-Encoding: quoted-printable」なりに符号化して送るほうがオーソドックスっぽいです。

 そうなると、UTF-7 な DSN を送ってくる Microsoft Exchange は相当ヤバイんでしょうか。

 いや、言われなくてもヤバイと思いますけれども。

[2258] Re: 用語「UTF-8」

えむけい (2004年9月30日 13時35分)

> 以上、RFC2279 2. UTF-8 definition () より

www.ietf.orgと入るはずのカッコの中が空になっています。

[2259] Re: 用語「UTF-8」

えむけい (2004年9月30日 13時36分)

> 以上、RFC2279 2. UTF-8 definition () より

www.ietf.orgと入るはずのカッコの中が空になっています。

[2261] Re: 用語「UTF-8」

ばけら (2004年9月30日 16時38分)

>> 以上、RFC2279 2. UTF-8 definition () より

>www.ietf.orgと入るはずのカッコの中が空になっています。

 RFC へのリンクは内部的には URN で書いてあるので処理がアレゲに……。

 とりあえず後ろ向きに対処しておきましたが、今後の検討課題とします。

[5130] Re:「UTF-8」

えむけい (2008年11月10日 19時34分)

> なお、UTF-8 では 8ビット目を使用していますので、そのまま SMTP を通すのは危険です。そのような場合は UTF-8 ではなく UTF-7 を使用します。

UTF-7はなかったことにされて、現在ではそのような場合はQuoted-printableやBase64でエンコードするのが普通ではないかと思います。

そもそも本当に7bitしか通さないトランスポート上でSMTPを使うこと自体めったにありませんからたいていESMTPで用が足りますし、HTTPですが8bit目を勝手につぶしたら脆弱性扱いされる時代ですし。

# ここではせがわさん【誰】の資料にリンクしたかったのですが、ページの途中にリンクできなくて残念な思いをしました。PDFですら特定のページを指定してリンクできるのに。

[5133] Re:「UTF-8」

ばけら (2008年11月11日 0時11分)

>UTF-7はなかったことにされて、現在ではそのような場合はQuoted-printableやBase64でエンコードするのが普通ではないかと思います。

 まあそうですねぇ。

 他にも全体的に記述が古いので、見直しておきます。

># ここではせがわさん【誰】の資料にリンクしたかったのですが、ページの途中にリンクできなくて残念な思いをしました。

 charset=US-ASCII で残念なことになるという話ですよね。

 US-ASCIIのほうの説明に足しておきます。

[5141] Re:「UTF-8」

【誰】 (2008年11月12日 0時39分)

># ここではせがわさん【誰】の資料にリンクしたかったのですが、ページの途中にリンクできなくて残念な思いをしました。PDFですら特定のページを指定してリンクできるのに。

こうですか?わかりません><

http://utf-8.jp/public/20080927/h6.html?file=data.txt&page=58

新規投稿フォーム

※広告や宣伝の書き込みはご遠慮ください。

:

:

:

最近の日記

関わった本など