ここでは,詳細な検索条件を指定するために,次の事柄について扱います。はじめて『ひまわり』をお使いになる方は,まず,「3.検索してみよう」をご覧ください。
検索条件として指定できるのは,次の三つの項目です。
検索対象は,「検索文字列」欄の左のプルダウンメニューで指定します。
上の例は,『太陽コーパス』(サンプル)の例ですが,次に示すように,資料のどの部分を検索対象とするかを設定することができます。
検索文字列は,三つの部分から構成されており,『ひまわり』では,次の三つの欄から入力します。この三つの欄は,検索結果の「前文脈」,「キー」,「後文脈」列に対応しており,三つの欄で指定した文字列と一致するものだけが,検索結果に含まれることになります。ただし,「前文脈」,「後文脈」欄は,資料や「検索対象」メニューの選択対象によって,インターフェイスが変わる可能性があります。詳しくは,この後述べます。
例えば,下の例では,「キー」列が「來」で,「後文脈」列が「た」で終わるものだけが検索されていることがわかります。
[国國]語 遊[ばびぶべぼ]
すでに述べたように,資料によっては,「前文脈」,「後文脈」欄が,次のようなインターフェイスになっている場合があります。このようになるのは,辞書の見出しを検索する場合のように,前後の文脈を考慮しないで,見出し単独で検索する場合です。詳しい説明は,各資料のマニュアルを参照してください。
このようなインターフェイスとなっている場合,「正規表現(前)」,「キー」,「正規表現(後)」欄の文字列をこの順序で連結したものが,(正規表現での)検索文字列になります。上の例では,『分類語彙表』の「表記」(見出し)に対して,正規表現の「^国語$」で検索を行っています。なお,^ は文字列の先頭を,$ は文字列の末尾を表します。これにより,「国語」の見出しだけを検索し,「母国語」や「外国語」は検索されなくなります。
「検索文字列」タブの隣の「フィルタ」タブをクリックすると,次のように,検索時のフィルタ用の欄が現れます。フィルタでは,下の例のように,検索結果を絞り込むための条件を指定することができます。
検索対象のコーパスが複数あるときは,次のように,「コーパス」タブに複数のコーパス名が表示されます。図の左側が現在,検索対象となっているコーパスで,右側が検索対象外になっているコーパスです。
「検索対象外」欄のコーパスを選択し,「追加」ボタンを押すと,検索対象となります。逆に,「検索対象」欄のコーパスを選択し,「除外」ボタンを押すと検索対象外になります。
ここでは,検索時に文脈に関係するオプションを設定します。
このタブでは,検索条件に一致した結果の出力を制御します。
このタブでは,字体変換におけるオプションを設定します。字体変換機能が提供されていない資料では,表示されません。どのような字体に変換されるかは,資料ごとに異なりますので,詳しい内容については,個々の資料のマニュアルを参照してください。
なお,標準添付される字体辞書は,常用漢字の新旧字体を記述したものです。したがって,「等価字体」「参考字体」の区別はありません。さらに,単純に異体字の関係にある字体に変換するだけであり,検索対象の資料において,「等価字体」「参考字体」の関係にあるとは限りません。