[PukiWiki]

全文検索システム『ひまわり』/I-JASプレインテキストの利用

Top/全文検索システム『ひまわり』/I-JASプレインテキストの利用

全文検索システム『ひまわり』

作成者:山口昌也 (国立国語研究所)
2020-08-24
 

1.概要†

 このページでは,I-JASのプレインテキストを『ひまわり』で利用する方法について説明します。

↑

2.準備†

  1. I-JASのホームページを参考に中納言のユーザ登録とI-JASの利用申請をしてください。
  2. 中納言にログインし,コーパス一覧のI-JASの備考欄から「テータ配布」のページを開いてください。
  3. プレインテキストのデータ(zipファイル)をダウンロードしてください。
    • 「対面調査(プレインテキスト)」「非対面調査(プレインテキスト)」の2種類があります。
    • CCH.zip のように圧縮してあるファイルがありますので,それをダウンロードしてください。
  4. 『ひまわり』をインストールしてください。
↑

3 『ひまわり』へのインポート†

 この方法は,『ひまわり』のインポート機能をデフォルト設定で利用するだけの簡単な方法です。

  1. 2の準備でダウンロードした,zipファイルを展開してください。
  2. 『ひまわり』を起動し,展開したフォルダを『ひまわり』にドラッグ&ドロップしてください。
    • 複数のzipファイルのデータをまとめて検索したい場合は,展開してフォルダを一つのフォルダにまとめて,トップのフォルダを『ひまわり』にドラッグ&ドロップしてください。
      -- トップのフォルダ
       |-- CCH
       |-- CCM
       --- EAU
  3. 「テキストデータインポート」というタイトルのウィンドウが現れますので,「インポート」ボタンを押してください。
  4. 以上で終了です。
    • ビデオチュートリアルのインポート(基礎編)も参考にしてください。簡単な使い方の説明もあります。
    • 単語検索したい場合は,インポート(応用編)を参考にしてください。なお,チュートリアルのページでは,形態素解析システムMeCabのインストールの方法も説明しています。

 なお,この方法では,テキストの構造を考慮せず,プレインテキストを全文検索するだけです。そのため,話者のIDなど,本文以外も検索対象になってしまいますので注意してください。

論文などで引用する際の
成果物の短縮URL

 

メニュー

  • コーパス
    • 『日本語話し言葉コーパス』
    • 『太陽コーパス』
    • 『近代女性雑誌コーパス』
       
  • 辞書関連
    • 形態素解析辞書『UniDic』
    • 語種辞書『かたりぐさ』
    • 『表記統合辞書』
    • 『分類語彙表増補改訂版』
       
  • 用例データベース
    • 複合動詞
    • サ変動詞
    • 形容詞
       
  • ソフトウェア
    • 全文検索システム『ひまわり』
    • 観察支援ツール FishWatchr
    • 観察支援ツール FishWatchr
      Mini
    • 作文支援システム TEachOtherS
    • 『ひまわり』支援ツール
    • 『たんぽぽ』,『プリズム』
       
  • 成果物の短縮URL
  • 講習会
     
    最新の10件
    2025-05-15
    • 観察支援ツール FishWatchr
    2025-04-08
    • 新着情報の履歴
    • 言語データベースとソフトウェア
    • 全文検索システム『ひまわり』/ダウンロード/UniDicパッケージ
    2025-04-02
    • 全文検索システム『ひまわり』
    • 全文検索システム『ひまわり』/ダウンロード/『青空文庫』パッケージ
    • 全文検索システム『ひまわり』/ダウンロード/『青空文庫』パッケージ/履歴
    2025-03-28
    • TEachOtherS
    2024-11-21
    • 成果物の短縮URL
    2024-06-11
    • 観察支援ツール FishWatchr/既知の問題

total:1266
today:1
yesterday:0

トップ   編集 凍結 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2020-08-25 (火) 11:06:17