#navi(../) &size(20){&color(red){本ページは現在構築中です};}; *1.『ひまわり』とは [#a11fc20c] 『ひまわり』は,言語研究用に設計された全文検索システムです。XML 文書から特定の文字列を高速に検索することができます。 『ひまわり』の主な機能は,次のとおりです。 - XML 文書に対する高速な全文検索機能 --検索対象の資料を XML 文書として記述すれば,さまざまな資料を検索対象とすることができます。現在,『ひまわり』で検索できる資料の例を次に挙げます。 ---青空文庫 ---国会会議録 ---『日本語話し言葉コーパス』(CSJ) ---『分類語彙表』 ---『名大会話コーパス』 --XML 文書の要素,属性を検索条件として指定することができます。 --インデックス(Suffix Array 方式)を利用して,高速な全文検索を実現しています。 -言語研究支援機能 --検索結果を KWIC (''K''ey''W''ord ''I''n ''C''ontext) の形式で表示することができます。 --XML 文書の要素や属性として付与されたさまざまな情報を資料に適した形式に整え,Webブラウザで閲覧することができます。例えば,書誌情報,引用情報,著者情報などの付与情報を参照することができます。 --さらに,付与情報を集計をすることができます(例:総文字数,総形態素数,総ルビ数,ngram)。 --自分で作成した言語資料(生テキスト,HTML,XML)を『ひまわり』にインポートすることができます。また,インポート時に形態素解析結果をアノテーションすることも可能です。 //--検索結果に対して,人手で annotation することができます。また,形態素解析システムなどの解析結果を言語資料に対して,annotation することができます。 #navi(../)