制作者(webmaster)
野嵜健秀(Takehide Nozaki)
初出
「闇黒日記」平成14年5月9日〜10日
公開
2002-09-15
改訂
2002-12-04

青空文庫」のXHTML化を斬る

青空文庫がXHTML 1.1に準據する方針を決めた、と云ふのでそらもよう 2002年5月7日、歡迎の聲が幾つか。

文書の生成に問題あり

しかし、現實に作られた文書(例へば宮本百合子 一本の花)は、「形式的にXHTML 1.1準據」に過ぎないもので、甚だ好ましくないマーク附けがなされてゐる。理由は明白。

HTML 版の作り方に関しては、メーリングリストで検討が始まった。

この際、W3C の勧告にあわせることと、コンピューターによる自動生成が目標として設定された。

HTML 版のあり方に関する検討は、鈴木厚司さん、内田明さん、もりみつじゅんじさんをはじめとする、リストの仲間によって進められた。

この自動生成プログラム、改行を取敢ず<br />に置換し、全體をdivで括る、と云ふ好い加減な代物なのである。當然見出しであるべき「一」「二」「三」……を見出しにせず、見出しにすべきものとも思はれない作者名をh2にする、と云ふどうしやうもない仕樣。

定義リストにすべき「書誌情報」も、brとdiv、そして全角の空白で整形されてゐる。

嗤ふべし、文末には以下のやうなソースの文言が書加へられてゐる。(「タブ文字」はコメントアウト)

●表記について<br />
<ul>
<li>このファイルは W3C 勧告 XHTML1.1 にそった形式で作成されています。</li>
</ul>

もうね、馬鹿か、阿呆かと以下略。

制作者の無知がそもそもの問題

これまで、もっぱら手作業でエキスパンドブックを作り、エディターで HTML ファイルを書いてきた私の目には、テキスト版を瞬時に仕立て直す大野さんと LUNA CAT さんのプログラムの手並みが、まるで魔法に見えた。

筆者はひよつとして、エディタで「改行」を「<br>改行」に置換する方法すら知らなかつたのだらうか。で、一々文末に<br>を書加へてゐたのではなからうか。でなければ、この程度の自動生成プログラム魔法とまで言つて稱揚する事は出來ない筈である。

結論

青空文庫がXHTML 1.1の規則に基いてマーク附けをするやうになつたと言つても、そのマーク附けは所詮、見た目に基いたマーク附けに過ぎず、制作者は相變らずHTMLに關してど素人のままなのだから、そんな青空文庫は賞讃するに値しない。

野嵜は青空文庫を應援してゐません。

ぷろじぇくと、みすじらからの改善提案