「UTF-8」へのコメント
「鳩丸ぐろっさり (用語集) : UTF-8」について、12件のコメントが書かれています。
[1289] Re: 鳩丸ぐろっさり (用語集) : 用語「UTF-8」
えむけい (2003年12月5日 14時0分)
> RFC2279 で定義されています。
> ※当初は RFC2044 でしたが、RFC2044 は RFC2279 によって破棄されました。
RFC3629が出ました。
[1290] Re: 鳩丸ぐろっさり (用語集) : 用語「UTF-8」
ばけら (2003年12月5日 17時16分)
>> RFC2279 で定義されています。
>> ※当初は RFC2044 でしたが、RFC2044 は RFC2279 によって破棄されました。
>RFC3629が出ました。
>http://www.ietf.org/rfc/rfc3629.txt
来たーっ。情報ありがとうございます。
今ちょっと読む時間が無いので、そのうち反映します。
[1293] Re: 鳩丸ぐろっさり (用語集) : 用語「UTF-8」
ばけら (2003年12月5日 21時17分)
> 今ちょっと読む時間が無いので、そのうち反映します。
軽く読んでみましたが、BOM の話が追加されたりしていますね。UTF-8 で BOM はどうなのよ? というのは割と FAQ だっただけにナイスかと。
セキュリティの所にもバッファオーバーフローの話が追加されていたりしますね。
[1296] Re: 鳩丸ぐろっさり (用語集) : 用語「UTF-8」
えむけい (2003年12月6日 2時11分)
>> 今ちょっと読む時間が無いので、そのうち反映します。
> 軽く読んでみましたが、BOM の話が追加されたりしていますね。UTF-8 で BOM はどうなのよ? というのは割と FAQ だっただけにナイスかと。
> セキュリティの所にもバッファオーバーフローの話が追加されていたりしますね。
U+10FFFFを超える範囲がバッサリ削られたのも大きいと思います(HTML4やXMLではもともとあっても使えなかったわけですが)。ぐろっさりの6オクテットシーケンスまで書かれた表は修正が必要ですね。
[1414] Re: 鳩丸ぐろっさり (用語集) : 用語「UTF-8」
こお (2003年12月20日 19時49分)
お初にお邪魔いたします。
メールでどうするかのお話ですが、今や過去の遺物扱い同然のUTF-7を使うより、UTF-8とかUTF-16とかUTF-32とかで書いたものをメールソフトの段階で「Content-Transfer-Encoding: base64」なり「Content-Transfer-Encoding: quoted-printable」なりに符号化して送るほうがオーソドックスっぽいです。
[1421] Re: 鳩丸ぐろっさり (用語集) : 用語「UTF-8」
ばけら (2003年12月22日 12時3分)
>メールでどうするかのお話ですが、今や過去の遺物扱い同然のUTF-7を使うより、UTF-8とかUTF-16とかUTF-32とかで書いたものをメールソフトの段階で「Content-Transfer-Encoding: base64」なり「Content-Transfer-Encoding: quoted-printable」なりに符号化して送るほうがオーソドックスっぽいです。
そうなると、UTF-7 な DSN を送ってくる Microsoft Exchange は相当ヤバイんでしょうか。
いや、言われなくてもヤバイと思いますけれども。
[2258] Re: 用語「UTF-8」
えむけい (2004年9月30日 13時35分)
> 以上、RFC2279 2. UTF-8 definition () より
www.ietf.orgと入るはずのカッコの中が空になっています。
[2259] Re: 用語「UTF-8」
えむけい (2004年9月30日 13時36分)
> 以上、RFC2279 2. UTF-8 definition () より
www.ietf.orgと入るはずのカッコの中が空になっています。
[2261] Re: 用語「UTF-8」
ばけら (2004年9月30日 16時38分)
>> 以上、RFC2279 2. UTF-8 definition () より
>www.ietf.orgと入るはずのカッコの中が空になっています。
RFC へのリンクは内部的には URN で書いてあるので処理がアレゲに……。
とりあえず後ろ向きに対処しておきましたが、今後の検討課題とします。
[5130] Re:「UTF-8」
えむけい (2008年11月10日 19時34分)
> なお、UTF-8 では 8ビット目を使用していますので、そのまま SMTP を通すのは危険です。そのような場合は UTF-8 ではなく UTF-7 を使用します。
UTF-7はなかったことにされて、現在ではそのような場合はQuoted-printableやBase64でエンコードするのが普通ではないかと思います。
そもそも本当に7bitしか通さないトランスポート上でSMTPを使うこと自体めったにありませんからたいていESMTPで用が足りますし、HTTPですが8bit目を勝手につぶしたら脆弱性扱いされる時代ですし。
# ここではせがわさん【誰】の資料にリンクしたかったのですが、ページの途中にリンクできなくて残念な思いをしました。PDFですら特定のページを指定してリンクできるのに。
[5133] Re:「UTF-8」
ばけら (2008年11月11日 0時11分)
>UTF-7はなかったことにされて、現在ではそのような場合はQuoted-printableやBase64でエンコードするのが普通ではないかと思います。
まあそうですねぇ。
他にも全体的に記述が古いので、見直しておきます。
># ここではせがわさん【誰】の資料にリンクしたかったのですが、ページの途中にリンクできなくて残念な思いをしました。
charset=US-ASCII で残念なことになるという話ですよね。
US-ASCIIのほうの説明に足しておきます。
[5141] Re:「UTF-8」
【誰】 (2008年11月12日 0時39分)
># ここではせがわさん【誰】の資料にリンクしたかったのですが、ページの途中にリンクできなくて残念な思いをしました。PDFですら特定のページを指定してリンクできるのに。
こうですか?わかりません><
http://utf-8.jp/public/20080927/h6.html?file=data.txt&page=58
「鳩丸ぐろっさり (用語集) : UTF-8」についてコメントを書く場合は、以下のフォームに記入してください。