#PCDATA (構文解析対象文字データ)
このデータを持つ要素 …… title, fieldset, option, textarea
このデータを持つグループ …… %inline;
#PCDATAの解説
PCDATA は Parsed Character Data の略で、「構文解析対象文字データ」です。Parsed というのは SGML 的に解釈 (パース) されるということを意味します。このデータ型は任意の長さを持つ (長さゼロでも良い) 任意のテキストですが、以下のような特徴を持ちます。
- 文字参照は展開されて対応する文字に置き換えられる。たとえば & と書くと & に置き換えられます。
- マークはマークとして解釈される。たとえば < はタグの開始区切り子と見なされます (当然そこで #PCDATA は終了しているものとみなされます)。また、<!-- --> を書けば注釈宣言とみなされ、その中身はコメントとして無視されます。
HTML のほとんどの要素は自らがこの #PCDATA を含めるか、もしくは子要素の中にこのデータを含めるようになっています。いわゆる「地の文」は、すべてこの #PCDATA という形式だと考えて構いません。
※ちなみに "#PCDATA" の頭についている "#" ですが、これは「予約名標識」と呼ばれるものです。内容モデルが CDATA や RCDATA となっている要素は他の要素を一切含みませんが、#PCDATA を含む要素は他の要素を含むこともできます (こういう内容モデルのことを「混合内容」と言います)。「PCDATA という名前の要素」も含み得ますから、それと明確に区別するために #PCDATA と表記するわけです。
- 「#PCDATA (構文解析対象文字データ)」にコメントを書く