[PukiWiki]

全文検索システム『ひまわり』/利用者マニュアル/1_6/1.『ひまわり』とは

Top/全文検索システム『ひまわり』/利用者マニュアル/1_6/1.『ひまわり』とは

  • Prev
  • Next
  • 全文検索システム『ひまわり』/利用者マニュアル/1_6

1.『ひまわり』とは†

 『ひまわり』は,言語研究用に設計された全文検索システムです。XML 文書から特定の文字列を高速に検索することができます。

 『ひまわり』の主な機能は,次のとおりです。

  • XML 文書に対する高速な全文検索機能
    • 検索対象の資料を XML 文書として記述すれば,さまざまな資料を検索対象とすることができます。現在,『ひまわり』で検索できる資料の例を次に挙げます。
      • 青空文庫
      • 国会会議録
      • 『日本語話し言葉コーパス』(CSJ)
      • 『分類語彙表』
      • 『名大会話コーパス』
    • XML 文書の要素,属性を検索条件として指定することができます。
    • インデックス(Suffix Array 方式)を利用して,高速な全文検索を実現しています。
  • 言語研究支援機能
    • 検索結果を KWIC (KeyWord In Context) の形式で表示することができます。
    • XML 文書の要素や属性として付与された情報を表示,集計することができます。
      • 検索文字列に対する書誌情報,引用情報,著者情報などの表示
      • 検索文字列を含む本文全体をWebブラウザで表示
      • 付与情報の集計(例:総文字数,総形態素数,総ルビ数,ngram)。
    • 自分で用意した言語資料(生テキスト,HTML,XML)を『ひまわり』にインポートすることができます。また,インポート時に形態素解析結果をアノテーションすることも可能です。

  • Prev
    全文検索システム『ひまわり』/利用者マニュアル/1_6
  • Next
    全文検索システム『ひまわり』/利用者マニュアル/1_6/2.インストール
  • Home
    Up

論文などで引用する際の
成果物の短縮URL

 

メニュー

  • コーパス
    • 『日本語話し言葉コーパス』
    • 『太陽コーパス』
    • 『近代女性雑誌コーパス』
       
  • 辞書関連
    • 形態素解析辞書『UniDic』
    • 語種辞書『かたりぐさ』
    • 『表記統合辞書』
    • 『分類語彙表増補改訂版』
       
  • 用例データベース
    • 複合動詞
    • サ変動詞
    • 形容詞
       
  • ソフトウェア
    • 全文検索システム『ひまわり』
    • 観察支援ツール FishWatchr
    • 観察支援ツール FishWatchr
      Mini
    • 作文支援システム TEachOtherS
    • 『ひまわり』支援ツール
    • 『たんぽぽ』,『プリズム』
       
  • 成果物の短縮URL
  • 講習会
     
    最新の10件
    2025-06-27
    • 新着情報の履歴
    • 言語データベースとソフトウェア
    • 観察支援ツール FishWatchr/履歴
    • 観察支援ツール FishWatchr
    2025-06-02
    • url
    2025-04-08
    • 全文検索システム『ひまわり』/ダウンロード/UniDicパッケージ
    2025-04-02
    • 全文検索システム『ひまわり』
    • 全文検索システム『ひまわり』/ダウンロード/『青空文庫』パッケージ
    • 全文検索システム『ひまわり』/ダウンロード/『青空文庫』パッケージ/履歴
    2025-03-28
    • TEachOtherS

total:3458
today:1
yesterday:0

トップ   編集 凍結 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2018-07-18 (水) 00:00:00