現在,本コンテンツは,保守されていません。
「青空文庫」からダウンロードしたファイルを,一つのフォルダにまとめてください。フォルダの名前は,なんでも構いません。ここでは,デスクトップ上の「aozora」というフォルダに,ダウンロードしたファイルをまとめることを前提に説明します。
「あおまめ」パッケージを解凍すると,「aomame」というフォルダができます。まず,「aomame」フォルダに次のファイルがあるか確認してください。
「AOMAME.hta」をダブルクリックして,「あおまめ」を起動してください。「あおまめ」が起動したら,次の二つのフォルダを指定してください。
上の図では,(a) はフォルダをデスクトップ上にある「aozora」フォルダ,(b) はデスクトップになっています。なお,(a), (b) の指定で,「taro」となっている部分は,ユーザ名であり,使用する環境により異なります。
「作成」ボタンを押して,デスクトップに「corpus.xml」というファイルができれば,変換は終了です。これが,『ひまわり』検索用のデータとなります。
次に,『ひまわり』検索用データ(corpus.xml)を『ひまわり』にインストールします。『ひまわり』がまだインストールされていない場合は,『ひまわり』利用者マニュアルを参照して,『ひまわり』のインストールを完了させてください。最新版の『ひまわり』はダウンロードのページにあります。
corpus.xml のインストールは,次の手順で行ってください。
次に,作成した corpus.xml に対して,「索引付け」を行います。「索引付け」は,高速に全文検索するために必要な処理です。
索引付けの手順は,次のとおりです。
以上で,検索用データ作成は終了です。実際に検索してみてください。検索方法は,[ 3.検索してみよう」を参照してください。
この節は,詳しい変換処理の内容を知りたい方や Windows 以外の OS をお使いの方のために設けてありますので,適宜,読み飛ばしてください。
青空文庫の XHTML ファイルから『ひまわり』で検索できる XML 文書への変換は,aozora.xsl で行っています。変換処理の内容は,aozora.xsl を参照してください。
3.3 節で実行する「AOMAME.hta」は,Windows 環境以外では動作しません。しかし,AOMAME.hta は,aozora.xsl を呼び出して,変換処理を行っていますので,手動で aozora.xsl を実行すれば,(Java が動作する環境であれば)変換を行うことができます。具体的な手順は,次のとおりです。
java org.apache.xalan.xslt.Process -in 変換対象ファイル名 -xsl aozora.xsl
java -Dhttp.proxyHost=Proxy のIPアドレス -Dhttp.proxyPort=Proxy のポート番号 org.apache.xalan.xslt.Process -in 変換対象ファイル名 -xsl aozora.xsl
以上で,corpus.xml が作成されました。