[PukiWiki]

全文検索システム『ひまわり』/ダウンロード/『ひまわり』ver.1.6/リリースノート/実行例20170120a の変更点

Top/全文検索システム『ひまわり』/ダウンロード/『ひまわり』ver.1.6/リリースノート/実行例20170120a

  • 追加された行はこの色です。
  • 削除された行はこの色です。
  • 全文検索システム『ひまわり』/ダウンロード/『ひまわり』ver.1.6/リリースノート/実行例20170120a へ行く。
  • 全文検索システム『ひまわり』/ダウンロード/『ひまわり』ver.1.6/リリースノート/実行例20170120a の差分を削除

[[全文検索システム『ひまわり』/ダウンロード/『ひまわり』ver.1.6/リリースノート]]

* 外部アノテーション結果の閲覧例 [#o2b16ca4]
+ 起動している『ひまわり』に config_aozora_sample.sd.xml をドラッグ&ドロップします。[ファイル]⇒[インストール]で指定しても同じことができます。
+ 起動している『ひまわり』に config_aozora_sample.sd.xml をドラッグ&ドロップします。[ファイル]⇒[新規]で指定しても同じことができます。
+ 適当な文字列を検索します。
+ 閲覧したい行を選択し,Shift キーを押しながら,ダブルクリックします。

|&ref(./browse_morph.png,60%);|

* 外部アノテーション(形態素解析)の実行 [#n7d144cf]
+ MeCabかJumanをインストールします。
+ 適当なフォルダに『ひまわり』にインポートしたいテキストファイルを用意します。なお,フォルダ名がコーパス名になります。
+ 起動している『ひまわり』にフォルダをドラッグ&ドロップします。
+ 詳細オプションを選択し,「形態素解析」オプションで,MeCabかJumanを選択します。
#br
|&ref(./import1.png,60%);|
#br
+ 「インポート」ボタンを押すと,インポートの処理が始まり,問題なくインポートできた場合は,そのまま検索できるようになります。
+ インポートしたコーパスの設定ファイルは,config_コーパス名.xml と config_コーパス名.sd.xml です。後者が形態素解析結果付きの検索用の設定ファイルです。
#br
|&ref(./import2.png,60%);|
#br


* 一覧内容の指定 [#sb9a1297]
+ 起動している『ひまわり』に config_aozora_sample.sd.xml をドラッグ&ドロップします。[ファイル]⇒[インストール]で指定しても同じことができます。
+ 起動している『ひまわり』に config_aozora_sample.sd.xml をドラッグ&ドロップします。[ファイル]⇒[新規]で指定しても同じことができます。
+[ツール]⇒[一覧]⇒[直接入力]を実行します。
+閲覧したい要素を指定します。ここでは,形態素(morph)の一覧を表示してみます。
++ 「上位タグ」で「morph」を選択します。
#br
|&ref(./list1.png,80%);|
#br
++ 「morph」に付与されている属性を選択します。
#br
|&ref(./list2.png,80%);|
#br
++ 「頻度」にチェックを入れます。
++ 「OK」を押すと,『青空文庫』サンプルに含まれる形態素の一覧を表示することができます。また,ステータスバーの部分に,延べと異なり数が表示されます。
#br
|&ref(./list3.png,80%);|
#br


* 文脈オプションの追加 [#a969dded]
+ 起動している『ひまわり』に config_aozora_sample.sd.xml をドラッグ&ドロップします。[ファイル]⇒[インストール]で指定しても同じことができます。
+ 起動している『ひまわり』に config_aozora_sample.sd.xml をドラッグ&ドロップします。[ファイル]⇒[新規]で指定しても同じことができます。
+[ツール]⇒[一覧]⇒[直接入力]を実行します。
+閲覧したい要素と文脈オプションを指定します。ここでは,形態素(morph)のbigramを作成します。
++ 「第1階層タグ」で「morph」を選択します。また,文脈オプションを1にし,さらに,頻度オプションをチェックします。なお,文脈オプションを2にすれば,trigramを求めることになります。
にチェックを入れます。
#br
|&ref(./list_settings1.png,80%);|
#br
++ 「morph」に付与されている属性として,「基本形」「品詞」を選択します。
#br
|&ref(./attributes2.png,80%);|
#br
++ 「OK」を押すと,bigramが表示されます。
#br
|&ref(./bigram.png,80%);|
#br

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS