[[全文検索システム『ひまわり』/利用者マニュアル/1_5]] &size(20){&color(red){本ページは現在構築中です};}; * 6. 言語資料にアノテーションする [#ia084527] ** 6.1 概要 [#t6b39075] 『ひまわり』には,3種類のアノテーション機能があります。これらの機能を使うと,登録されている言語資料に付加的に情報をアノテーションすることができます。アノテーションしたデータは,元の言語資料にアノテーションされているデータと同様に検索することができます。 『ひまわり』には,3種類のアノテーション機能があります。これらの機能を使うと,登録されている言語資料に付加的に情報をアノテーション(注釈付け)することができます。アノテーションしたデータは,元の言語資料にアノテーションされているデータと同様に検索することができます。 - 人手アノテーション ... 検索結果に対して人手でアノテーションします - 外部アノテーション ... 形態素解析システムなど外部システムを使ったアノテーションです - データのインポート ... アノテーションデータをファイルからインポートします アノテーションした結果は,『ひまわり』内部のデータベースに保存されます。ただし,登録されている言語資料自体(XMLデータ)には変更は加えません。 ** 6.2 人手アノテーション [#p0e74d35] // 検索した結果に対して,アノテーションします。例として,『ひまわり』に同梱されている『青空文庫サンプル』に対して,人手アノテーション //[[3.1節>]]を参考にして,ァイルconfig_aozora_sample.xml を この機能は,検索した結果に対して,なんらかの情報をアノテーションするために利用します。例えば,必要な用例には○,不要な用例には×をつけるといった用途です。 実際の例として,『ひまわり』に同梱されている『青空文庫サンプル』に対して,人手アノテーションしてみましょう。『青空文庫サンプル』は,[[3.1節>]]を参考にして,設定ファイル config_aozora_sample.xml を読み込んでください。 次の図は,『青空文庫サンプル』に対して「##」を検索した結果です。検索結果欄の「メモ1」「メモ2」列がアノテーション用の列です。この列は,他の列と異なり,編集できるようになっています。『青空文庫サンプル』の設定では,「メモ1」列が自由記述の入力,「メモ2」が選択式の入力となっています。 ** 6.3 自動アノテーション [#q6041ade] 自動アノテーションは,『ひまわり』とは別の外部プログラムを使って,『ひまわり』に登録されている言語資料にアノテーションします。『青空文庫サンプル』の設定では,形態素解析システムの JUMAN と MeCab の解析結果をアノテーションすることができます。 ** 6.4 データのインポート [#xbb7ed4a] データのインポートは,アノテーション情報を格納したファイルに基づいて,アノテーションする機能です。 ** 6.5 設定 [#me951a0e] ここでは,アノテーションに関する設定について説明します。