全文検索システム『ひまわり』/利用者マニュアル/1_5/6.言語資料にアノテーションする
をテンプレートにして作成
開始行:
#navi(../)
//&size(20){&color(red){本ページは現在構築中です};};
* 6. 言語資料にアノテーションする [#ia084527]
** 6.1 概要 [#t6b39075]
『ひまわり』には,3種類のアノテーション機能があります...
- 人手アノテーション ... 検索結果に対して人手でアノテーシ...
- 外部アノテーション ... 形態素解析システムなど外部システ...
- データのインポート ... アノテーションデータをファイルか...
アノテーションした結果は,『ひまわり』内部のデータベー...
** 6.2 人手アノテーション [#p0e74d35]
この機能は,検索した結果に対して,なんらかの情報をアノ...
実際の例として,『ひまわり』に同梱されている『青空文庫...
次の図のように,検索結果欄の「メモ1」「メモ2」列があ...
#ref(./example_edit.png,wrap,center)
「自由記述」の列の場合,その言葉のとおり,自由な記入が...
なお,効率的なアノテーションのために,次の機能が用意さ...
- アノテーションしたい範囲を選択し,右クリック→[マーク]を...
- 選択範囲が1セルの場合,その値が当該の列のすべての欄に...
編集が終わったら,ウィンドウ右下の「保存する」ボタンを...
#ref(./save_annotation.png,wrap,center)
** 6.3 自動アノテーション [#q6041ade]
自動アノテーションは,『ひまわり』とは別の外部プログラ...
自動アノテーションを実行するには,[ツール]→[アノテーシ...
この機能を使う場合は,次の点に留意して下さい。
- [[JUMAN>http://nlp.ist.i.kyoto-u.ac.jp/index.php?cmd=re...
-- JUMAN: ver.7.0 Windows 32bit版,および,Ubuntu 12.04版...
-- MeCab: ver.0.996 Windows版,および,Ubuntu 12.04 版(ve...
- &color(red){すでに自動アノテーションしている場合は,上...
- 言語資料が巨大な場合,アノテーションに時間がかかる場合...
- 処理の途中でエラーが発生することを考慮し,himawari.exe ...
自動アノテーションが完了したら,専用の設定ファイル(DB...
DB検索用設定ファイルを読み込むと,次のように,結果表示...
#ref(./result_db_search.png,wrap,center)
config_aozora_sample_db.xml の設定では,次のような検索...
#ref(./search_target_db.png,wrap,right,around)
:本文|全文検索します。検索文字列が形態素の場合,形態素解...
:本文(正規表現)|本文を全文検索します。正規表現での検索が...
:基本形|基本形で検索します。活用語を検索する際に便利です。
:読み|読みで検索します。なお,読みは,JUMANの場合,ひらが...
:出現形|出現形で検索します。
:ルビ(rt)完全一致|本文に付与されているルビを検索します。...
:ルビ(rt)部分一致|本文に付与されているルビを検索します。...
:メモ1|「メモ1」列を検索します。文字列のマッチングは,...
:メモ2|「メモ2」列を検索します。この列も部分一致検索と...
#clear
** 6.4 データインポート [#xbb7ed4a]
データインポート機能は,アノテーション情報を格納したフ...
&color(red){本機能は,ver.1.5では使用が制限されています...
//** 6.5 設定 [#me951a0e]
// ここでは,アノテーションに関する設定について説明しま...
#navi(../)
終了行:
#navi(../)
//&size(20){&color(red){本ページは現在構築中です};};
* 6. 言語資料にアノテーションする [#ia084527]
** 6.1 概要 [#t6b39075]
『ひまわり』には,3種類のアノテーション機能があります...
- 人手アノテーション ... 検索結果に対して人手でアノテーシ...
- 外部アノテーション ... 形態素解析システムなど外部システ...
- データのインポート ... アノテーションデータをファイルか...
アノテーションした結果は,『ひまわり』内部のデータベー...
** 6.2 人手アノテーション [#p0e74d35]
この機能は,検索した結果に対して,なんらかの情報をアノ...
実際の例として,『ひまわり』に同梱されている『青空文庫...
次の図のように,検索結果欄の「メモ1」「メモ2」列があ...
#ref(./example_edit.png,wrap,center)
「自由記述」の列の場合,その言葉のとおり,自由な記入が...
なお,効率的なアノテーションのために,次の機能が用意さ...
- アノテーションしたい範囲を選択し,右クリック→[マーク]を...
- 選択範囲が1セルの場合,その値が当該の列のすべての欄に...
編集が終わったら,ウィンドウ右下の「保存する」ボタンを...
#ref(./save_annotation.png,wrap,center)
** 6.3 自動アノテーション [#q6041ade]
自動アノテーションは,『ひまわり』とは別の外部プログラ...
自動アノテーションを実行するには,[ツール]→[アノテーシ...
この機能を使う場合は,次の点に留意して下さい。
- [[JUMAN>http://nlp.ist.i.kyoto-u.ac.jp/index.php?cmd=re...
-- JUMAN: ver.7.0 Windows 32bit版,および,Ubuntu 12.04版...
-- MeCab: ver.0.996 Windows版,および,Ubuntu 12.04 版(ve...
- &color(red){すでに自動アノテーションしている場合は,上...
- 言語資料が巨大な場合,アノテーションに時間がかかる場合...
- 処理の途中でエラーが発生することを考慮し,himawari.exe ...
自動アノテーションが完了したら,専用の設定ファイル(DB...
DB検索用設定ファイルを読み込むと,次のように,結果表示...
#ref(./result_db_search.png,wrap,center)
config_aozora_sample_db.xml の設定では,次のような検索...
#ref(./search_target_db.png,wrap,right,around)
:本文|全文検索します。検索文字列が形態素の場合,形態素解...
:本文(正規表現)|本文を全文検索します。正規表現での検索が...
:基本形|基本形で検索します。活用語を検索する際に便利です。
:読み|読みで検索します。なお,読みは,JUMANの場合,ひらが...
:出現形|出現形で検索します。
:ルビ(rt)完全一致|本文に付与されているルビを検索します。...
:ルビ(rt)部分一致|本文に付与されているルビを検索します。...
:メモ1|「メモ1」列を検索します。文字列のマッチングは,...
:メモ2|「メモ2」列を検索します。この列も部分一致検索と...
#clear
** 6.4 データインポート [#xbb7ed4a]
データインポート機能は,アノテーション情報を格納したフ...
&color(red){本機能は,ver.1.5では使用が制限されています...
//** 6.5 設定 [#me951a0e]
// ここでは,アノテーションに関する設定について説明しま...
#navi(../)
ページ名: