[[全文検索システム『ひまわり』/青空文庫の文書を『ひまわり』で利用する方法2]] *変換スクリプトの内容と定義 [#l66416cc] **「青空文庫」変換スクリプトパッケージの内容 [#sa5fbab7] -config_aozora.xml : 『ひまわり』設定ファイル -Corporaフォルダ --&color(darkorange){aozora.xml}; : コーパスファイル --aozora.bat : 全てのバッチファイルを実行するバッチファイル --copy_html.bat : CD-ROMからHTMLファイルをダウンロードするバッチファイル --copy-pics.bat : CD-ROMから画像ファイルをダウンロードするバッチファイル --xsl.bat : HTMLファイルをXMLファイルに変換するバッチファイル --allinone.bat : 全てのファイルをまとめたコーパスファイルを作成し,文字コード・改行コードを調整するバッチファイル --aozora.xsl : XHTMLファイルをXMLファイルに変換するXSLファイル --xslt.js : XHTMLファイルをXMLファイルに変換するスクリプト --head.xml : コーパスファイルの宣言とルートノード --foot.xml : コーパスファイルのルートノードを閉じるタグ --xsltフォルダ ---kotobun_written.xsl : 検索文字列が含まれる記事を表示するためのXSLファイル ---kotobun_written.css : 検索文字列が含まれる記事を表示するためのカスケードシート ---&color(darkorange){illustrationフォルダ}; : 画像ファイル ---&color(darkorange){gaijiフォルダ}; : 外字の画像ファイル --&color(darkorange){xhtmlフォルダ}; : ダウンロードしたHTMLファイルを格納するフォルダ --&color(darkorange){xmlフォルダ}; : 生成したXMLファイルを格納するフォルダ ※&color(darkorange){オレンジ色};で書かれたものは,変換スクリプト(aozora.bat)を実行することによって生成されるファイル・フォルダです。 **「青空文庫」変換スクリプト タグ定義 [#zf0a9a82] -以下に「青空文庫」のXHTMLタグに対応するXMLタグを示しました。尚,全てのXHTMLタグをXML化したわけではありません。 -ここには「青空文庫」のXHTMLタグと対応しているもののみ載せました。全体の仕様は,以下のページと合わせてご覧ください。 --[[''共有データ形式/書き言葉''>../../共有データ形式/書き言葉]] --[[''共有データ形式/書き言葉''>../../共有データ形式/書き言葉]] (準備中) ***タグリスト [#v235dfcf] ※以下 「青空文庫」XHTMLタグ : &color(darkgreen){Kotobun XMLタグ}; で示しました。 &br;※タグの分類はKotobunの仕様に合わせてあります。 -文書構造に関連するタグ --文書の構造 ---<html> : &color(darkgreen){<記事 タイトル="&color(gray){作品名};" 著者="&color(gray){著者名};">}; ---<body> : &color(darkgreen){<テキスト 種別="本文">}; ---<div class="main_text"> : &color(darkgreen){<階層 種別="h1" タイトル="&color(gray){作品名};">}; --ヘッダ・フッタ ---<head> : &color(darkgreen){<ヘッダ>(内容は<!-- &color(gray){著作権情報}; -->「タイトル」「サブタイトル」「原題」「著者」「翻訳者」「編者」)}; ---該当なし : &color(darkgreen){<フッタ>(内容は<ブロック 種別="書誌情報"> <ブロック 種別="表記について"> &color(gray){著作権情報};)}; --タイトル・著者等 ---<h1 class="title"> : &color(darkgreen){<記事 タイトル="&color(gray){作品名};">/<タイトル>/ヘッダ内で「タイトル」として要素内容を表示}; ---<h2 class="author"> : &color(darkgreen){<記事 著者="&color(gray){著者名};">/<著者>/ヘッダ内で「著者」として要素内容を表示}; ---<h2 class="editor"> : &color(darkgreen){<著者>/ヘッダ内で「編者」として要素内容を表示}; ---<h2 class="original_title"> : &color(darkgreen){<タイトル>/ヘッダ内で「原題」として要素内容を表示}; ---<h2 class="subtitle"> : &color(darkgreen){<タイトル>/ヘッダ内で「サブタイトル」として要素内容を表示}; ---<h2 class="translator"> : &color(darkgreen){<著者>/ヘッダ内で「翻訳者」として要素内容を表示}; --ブロック ---<div class="burasage"> : &color(darkgreen){<ブロック 種別="ぶら下げ">}; ---<div class="chitsuki_&color(gray){0};" style="&color(gray){text-align:right; margin-right: 0em};"> : &color(darkgreen){<ブロック 種別="地付き" style="&color(gray){text-align:right; margin-right: 0em};">}; ---<div class="jisage_&color(gray){3};" style="&color(gray){margin-left: 3em};"> : &color(darkgreen){<ブロック 種別="字下げ" style="&color(gray){jisage_3" style="margin-left: 3em};">}; ---<div class="bibliographical_information"> : &color(darkgreen){<ブロック 種別="書誌情報">}; ---<div class="notation_notes"> : &color(darkgreen){<ブロック 種別="表記について">}; -位置に関するタグ --<br> : &color(darkgreen){<b />}; -注記・校正に関するタグ --<span class="notes">[#&color(gray){注記内容};]</span> : &color(darkgreen){<注 種別="注記" 付与="入力" 内容="[#&color(gray){注記内容};]"></注>}; --<span class="warichu"> : &color(darkgreen){<割書>}; -文字・表記に関するタグ --<ruby><rb>&color(gray){先刻};</rb><rp>&color(gray){(};</rp><rt>&color(gray){さっき};</rt><rp>&color(gray){)};</rp></ruby> : &color(darkgreen){<r rt="&color(gray){さっき};">&color(gray){先刻};</r>}; --<small> : &color(darkgreen){<小書>}; -その他のタグ --<b> : &color(darkgreen){<span 種別="強調">}; --<em class="&color(gray){underline_double};"> : &color(darkgreen){<span 種別="傍線" 備考="&color(gray){underline_double};">}; --<strong class="&color(gray){BLACK_CIRCLE};"> : &color(darkgreen){<span 種別="傍点" 備考="&color(gray){BLACK_CIRCLE};">}; --<sub> : &color(darkgreen){<span 種別="強調" 備考="下付き">}; --<sup> : &color(darkgreen){<span 種別="強調" 備考="上付き">}; -画像に関するタグ --<img gaiji="gaiji" src="&color(gray){ディレクトリ名・画像名};" alt="&color(gray){解字・文字コード};)" class="gaiji" /> : &color(darkgreen){<画像 src="&color(gray){ディレクトリ名・画像名};" alt="&color(gray){解字・文字コード};" 備考="gaiji">}; --<img class="illustration" width="&color(gray){画像幅};" height="&color(gray){画像高};" src="画像名" alt="画像の説明" /> : &color(darkgreen){<画像 src="&color(gray){ディレクトリ名・画像名};" alt="&color(gray){画像の説明};" height="&color(gray){画像幅};" width="&color(gray){画像高};" 備考="illustration"/>};