#author("2021-10-31T14:07:34+09:00","default:rd","rd") #author("2021-10-31T14:09:36+09:00","default:rd","rd") [[全文検索システム『ひまわり』]] * 『青空文庫』サンプルとは [#l5e5c989] 『青空文庫』サンプルは,全文検索システム『ひまわり』のテスト検索用の言語資料として,[[『青空文庫』>http://www.aozora.gr.jp/]]の次の4作品を収録したものです。『ひまわり』にデフォルトで同梱されています。 - 芥川龍之介:猿蟹合戦 - 芥川龍之介:蜘蛛の糸 - 夏目漱石:こころ - 夏目漱石:吾輩は猫である 収録に際しては,次の処理を行なっています。 - 上記作品の XHTML版を[[テキストインポート機能>全文検索システム『ひまわり』/利用者マニュアル/1_7/7.言語資料をインポートする]]により,『ひまわり』にインポート - インポート時に形態素解析システム MeCab により単語情報を付与 * 使い方 [#n54ae04d] **2.1 『青空文庫』サンプルを検索対象にするには [#ac1e8410] * 『青空文庫』サンプルを検索対象にするには [#n54ae04d] - 『青空文庫』サンプルを検索対象とするには,『ひまわり』を起動し,[ファイル]→[コーパス選択]で「『青空文庫』サンプル」を選択してください。 - コーパス選択時に「外部DB」欄を「あり(sd)」にすると,単語検索ができるようになります。 **2.2 検索方法 [#t61e330f] 検索対象は,次のように,メニューで選択することができます。メニューの詳細については,[[「6.3節 自動アノテーション」>全文検索システム『ひまわり』/利用者マニュアル/1_5/6.言語資料にアノテーションする#q6041ade]]を参照してください。また,検索一般については,[[4.詳細な条件で検索する>全文検索システム『ひまわり』/利用者マニュアル/1_2/4.詳細な検索を行う]]もあわせてご覧ください。 &ref(全文検索システム『ひまわり』/利用者マニュアル/1_5/6.言語資料にアノテーションする/search_target_db.png,center,検索対象の選択); ** 2.3 検索結果の見方 [#pf30b448] -''前文脈'': 検索文字列の前文脈 -''キー'': 検索文字列 -''後文脈'': 検索文字列の後文脈 -''Path'': 青空文庫でのファイル名,および,インポート時のディレクトリ構成 -''タイトル'': 作品のタイトル名 -''著者'': 作品の著者名 コーパス選択時に「外部DB」欄を「あり(sd)」にすると,次の情報が追加されます。 -''基本形'': キー欄の文字列の基本形 -''読み'': キー欄の文字列の読み -''品詞'': キー欄の文字列の品詞 -''基本形-2'': キー欄の文字列の二つ前の形態素の基本形 -''基本形-1'': キー欄の文字列の一つ前の形態素の基本形 -''基本形1'': キー欄の文字列の一つ後の形態素の基本形 -''基本形2'': キー欄の文字列の二つ後の形態素の基本形 * 謝辞 [#f63b2c1c] 収録作品の著者の方々,有益なデータを提供してくださる青空文庫の運営者,工作員の方々に心より感謝いたします。