次に,作成した corpus.xml に対して,「索引付け」を行います。「索引付け」は,高速に全文検索するために必要な処理です。
索引付けの手順は,次のとおりです。
以上で,検索用データ作成は終了です。CSJ2Himawari フォルダは削除してもかまいません。
ここでは,『日本語話し言葉コーパス』サンプルデータに固有の事柄について説明します。『ひまわり』自体の一般的な使い方については,利用者マニュアルをご覧ください。また,検索結果のデータの見方については,次のマニュアルを参照してください。なお,閲覧には,Adobe 社の Adobe Reader が必要です。Adobe 社の Web ページで無償配布しています
インストールしたデータを検索対象とするには,『ひまわり』を起動し,[ファイル]→[新規]で config_csj_manual.xml を読み込んでください。
次の項目を対象として,検索することができます。利用者マニュアルの4.1 節もあわせてご覧ください。
検索結果をダブルクリックすると,当該の検索文字列を含んだ転記テキストを閲覧することができます。