[PukiWiki]

全文検索システム『ひまわり』/I-JASプレインテキストの利用 の履歴(No.9)


  • 履歴一覧
  • 差分 を表示
  • 現在との差分 を表示
  • ソース を表示
  • 全文検索システム『ひまわり』/I-JASプレインテキストの利用 へ行く。
    • 1 (2020-08-25 (火) 00:59:04)
    • 2 (2020-08-25 (火) 01:50:07)
    • 3 (2020-08-25 (火) 02:03:26)
    • 4 (2020-08-25 (火) 02:06:24)
    • 5 (2020-08-25 (火) 02:09:04)
    • 6 (2020-08-25 (火) 02:11:20)
    • 7 (2020-08-25 (火) 02:13:43)
    • 8 (2020-08-25 (火) 02:13:56)
    • 9 (2020-08-25 (火) 02:14:30)
    • 10 (2020-08-25 (火) 02:18:47)
    • 11 (2020-08-25 (火) 02:23:23)
    • 12 (2020-08-25 (火) 02:26:16)
    • 13 (2020-08-25 (火) 02:35:07)
    • 14 (2020-08-25 (火) 02:48:26)

全文検索システム『ひまわり』

作成者:山口昌也 (国立国語研究所)
2020-08-24
 

1.概要†

 このページでは,I-JASのプレインテキストを『ひまわり』で利用する方法について説明します。

↑

2.準備†

  1. I-JASのホームページを参考に中納言のユーザ登録とI-JASの利用申請をしてください。
  2. 中納言にログインすると,コーパス一覧のI-JASの備考欄に「テータ配布」へのリンク先からデータをダウンロードしてください。
    • 「対面調査(プレインテキスト)」「非対面調査(プレインテキスト)」の2種類があります。
    • 上記のリンク先のページに,CCH.zip のように圧縮してあるファイルがありますので,それをダウンロードしてください。
↑

3 『ひまわり』へのインポート†

 この方法は,『ひまわり』のインポート機能をデフォルト設定で利用するだけの簡単な方法です。

  1. 2の準備でダウンロードした,zipファイルを展開してください。
  2. 『ひまわり』を起動し,展開したフォルダを『ひまわり』にドラッグ&ドロップしてください。
    • 複数のzipファイルのデータをまとめて検索したい場合は,展開してフォルダを一つのフォルダにまとめて,トップのフォルダを『ひまわり』にドラッグ&ドロップしてください。
      -- トップのフォルダ
       |-- CCH
       |-- CCM
       --- EAU
  3. 「テキストデータインポート」というタイトルのウィンドウが現れますので,「インポート」ボタンを押してください。
  4. 以上で終了です。
    • ビデオチュートリアルのインポート(基礎編)も参考にしてください。
    • 単語検索したい場合は,インポート(応用編)を参考にしてください。なお,チュートリアルのページでは,形態素解析システムMeCabのインストールの方法も説明しています。

 なお,この方法では,話者のIDも検索対象になってしまいますので注意してください。


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS