#author("2021-10-31T00:58:04+09:00","default:rd","rd") #author("2021-10-31T00:58:52+09:00","default:rd","rd") #navi(../) //&size(20){&color(red){本ページは現在構築中です};}; *3.検索してみよう [#n1fb33c4] このページでは,『ひまわり』を使って,簡単な検索をするところまで説明します。本ページで扱う内容は,次のとおりです。 - 言語資料の選択・インストール -簡単な検索の方法 -検索結果の見方 -検索結果を詳しく見る(検索結果の並べ替え,記事全体の閲覧など) **3.1 言語資料の選択&aname(how_to_select); [#kbc7241f] まず,『ひまわり』を起動しましょう。『ひまわり』の起動方法は,「[[2.3 『ひまわり』の起動>../2.インストール#how_to_execute]]」を参照してください。 - 『ひまわり』をインストールした直後は,起動すると,[[『青空文庫』(サンプル)>全文検索システム『ひまわり』/『青空文庫』サンプル]]が検索できる状態になります。 - 検索対象の言語資料を変更するには,[ファイル]→[コーパス選択] を実行し,検索したい言語資料を選択して下さい。 -- 言語資料自体に直接アノテーションされていないデータ(例:形態素解析結果)が利用できる場合,「外部DB」で「あり」を選択することができます。 //-- 『ひまわり』には標準で[[『分類語彙表』(サンプル)>全文検索システム『ひまわり』/『分類語彙表』サンプル]]も同梱されています。 -- 『青空文庫』(サンプル)が2項目表示されますが,どちらも同じ内容です。 #ref(../../1_6/3.検索してみよう/himawari_select_corpus.png,center,75%,言語資料の選択) **3.2 言語資料のインストール [#k606d4ce] 『ひまわり』の[[ホームページ>[[全文検索システム『ひまわり』]]では,『ひまわり』用の言語資料(パッケージ)が配布されています。 - 『青空文庫』パッケージ - 『国会会議録』パッケージなど パッケージを『ひまわり』にインストールするには,次のようにします。 + パッケージのファイルをダウンロードして下さい。通常,zip形式で圧縮されていますが,展開(解凍)する必要はありません。 + 『ひまわり』を起動して,パッケージファイルを『ひまわり』にドラッグ&ドロップしてください。 + 「インストールが終了しました」と表示されれば,パッケージのインストールは完了です。 #ref(../../1_6/3.検索してみよう/himawari_package_install.png,center,70%,パッケージのインストール) **3.3 簡単な検索の方法 [#n78d015e] // まず,『ひまわり』を起動しましょう。『ひまわり』の起動方法は,「[[2.インストール>ひまわり/利用者マニュアル/1_2/2.インストール#how_to_execute]]」を参照してください。 『ひまわり』が起動したら,検索したい文字列を「検索文字列」欄に書き込んでください。検索文字列を書き込んだら,「検索」ボタンを押してください。下の例では,「あの」を検索しています。 検索が始まると,画面下の「メッセージ」欄に「検索中 ...」と表示されます。検索が終わると,「検索結果表示」欄に検索結果が表示されるとともに,「メッセージ」欄に検索総数が表示されます。下の例では,40 件検索されたことがわかります。 #ref(../../1_6/3.検索してみよう/himawari_search3a.png,center,75%) // 『ひまわり』が起動したら,検索したい文字列を「検索文字列」欄に書き込 // んでください。検索する資料によっては,「字体変換」ボタンが表示され,字 // 体変換機能が利用できる場合があります。このボタンを押すと,入力した文字 // 列を旧字体や異体字に変換することができます。例えば,『太陽コーパス』(サ // ンプル版)で,「来」と入力して,このボタンを押すと,「[来來]」と変換され // ます((使用している字体辞書の内容に依存します。))。この検索文字列は, // 「来」「來」の両方にマッチします。 **3.4 検索結果の見方 [#wffd88d8] 検索結果は,1行が1件の検索結果に対応します。どのような情報が検索されるかは,検索対象の資料によって異なります。参考のために,『青空文庫』サンプルの検索結果に含まれる列の内容を次に示します。 |列名 |内容 |h |前文脈 |検索文字列に対する前文脈| |キー |検索文字列 | |後文脈 |検索文字列に対する後文脈 | |Path |原資料のファイルのパス(パッケージ作成時)| |題名 |記事の題名| |著者 |記事の著者| **3.5 検索結果を詳しく見る [#z9d8cf63] ***3.5.1 検索結果の並べ替え(ソート) [#s5b7efd8] 検索直後の検索結果の並び順は,言語資料ごとに定義されています。例えば,『青空文庫』サンプルでは,「後文脈」が昇順になるようになっています。 検索結果を自分の好みの列で並べ替えたいときは,「検索結果」欄の列名の部分を左クリックしてください。例えば,「著者」をクリックすると,同一著者の検索結果をまとめることができます。 #ref(../../1_6/3.検索してみよう/himawari_sort.png,center,wrap) 並べ替えは,次の規則に基づいて行われます。 -各セルの先頭の文字から順に文字コード(Unicode として解釈される点に注意)の大小を比較していくことにより決定されます。ただし,「前文脈」の欄だけは,その性質上,欄中の末尾の文字から順に比較していきます。 -複数の列で並べ替えを行うには,列の優先順序の逆順で,列をクリックしてください。例えば,優先順序を「タイトル」,「後文脈」とした場合は,「後文脈」,「タイトル」の順に列名の部分をクリックしてください。 -列名の部分をクリックするごとに,「昇順」「降順」がトグルするようになっています。 ***3.5.2 より広い範囲での閲覧&aname(sssec3_4_2); [#m0360719] 閲覧したい検索結果のセルを左ダブルクリックしてください。Web ブラウザが起動し,KWIC (''K''ey''W''ord ''I''n ''C''ontext) よりも広い文脈で,当該の検索文字列を参照することができます。表示される範囲は資料によって異なりますが,『青空文庫』サンプルの場合,1作品全体が表示されます。なお,赤くなっている文字列が検索対象の文字列です。 #ref(../../1_6/3.検索してみよう/himawari_browsing.png,center,80%) ***3.5.3 検索結果の絞込み [#x3a7a4f8] 検索結果を列ごとに条件を設定して,絞込みを行う機能です。複数の列に対して,条件を設定することができます。 検索結果の絞込みを行うには,絞り込みの条件を設定する列の列名にマウスカーソルを合わせ,右クリックしてください。次の例は,「欄名」欄で絞込みの条件を設定しているところです。表示されたウィンドウには,その列に含まれている値が列挙されるので,その中から選択してください。 #ref(../../1_6/3.検索してみよう/himawari_filter1.png,center,wrap) 絞込みの条件は,正規表現でも設定することができます。[文字列を指定]を選択すると,次のウィンドウが現れるので,正規表現を指定してください。 #ref(../../1_6/3.検索してみよう/himawari_filter2.png,center) 絞込みの解除を行うには,絞込みの条件を設定した列の列名の部分で,右クリックしてください。次のウィンドウが現れるので,[フィルタ解除]を選択してください。設定した絞込み条件が解除されます。ただし,すべての列の絞込み条件が解除されることに注意してください。 #ref(../../1_6/himawari_cancel_filter.png,center,wrap) #ref(../../1_6/3.検索してみよう/himawari_cancel_filter.png,center,wrap) ***3.5.4 列幅の変更 [#mf55525c] 列名の部分で,列と列の間にマウスカーソルを合わせると,マウスカーソルの形状が←→のようになります。そのときに,左クリックしながらマウスを移動させると列の幅を変更できます。 #ref(../../1_6/3.検索してみよう/himawari_change_column_width.png,center,wrap) ***3.5.5 セルの値の参照 [#jac0d505] 検索結果の個々のセルを詳しく見るには,そのセルを左クリックしてみてください。すると,そのセルの値が「セル値表示」欄に表示されます。 #ref(../../1_6/3.検索してみよう/himawari_cell_value.png,center,wrap) ***3.5.6 複数の検索結果を保持する [#y4f0c452] 検索結果欄の左下のタブを増やすと,複数の検索結果を保持しておくことができます。下図(左)のように,タブを右クリックすると,「表の追加」というのメニューが現れ,新規に検索を行うことができます。表の切り替えは,タブをクリックしてください。タブを削除するには,下図(右)のように,タブを右クリックして,メニューから削除を選択します。 #ref(../../1_6/3.検索してみよう/himawari_tab.png,center,wrap) #navi(../)