#author("2023-01-31T22:58:22+09:00","default:rd","rd") [[講習会/全文検索システム『ひまわり』講習会 (2023-02-27)]] &size(20){&color(red){本ページは構築中です。};}; CENTER:&size(20){全文検索システム『ひまわり』講習会 事前資料}; #br #br RIGHT:2023-02-xx RIGHT:山口昌也(国語研究所) #br #br #contents * 1.概要 [#wbe389b4] - 事前準備として,次のことを行っていただきます。 -- 講習会で使用するコーパス(2種)の利用許諾 -- 『ひまわり』などのツールのインストール #br - 準備を行う前に,次のことを確認してください。 -- 事前準備は,講習会当日使用するPCをインターネットに接続して,行なって下さい。 -- 使用するPCのディスク容量に余裕があることを確認してください。ツールや資料のインストールに2GB程度必要です。 -- インストール先 PC の OSは,Windows,macOS を想定しています。これ以外のOSを利用することになった方は,事前にご相談ください。 -- また,Windowsで言語設定を日本語以外にしていて,問題が出るようでしたら,言語設定を一時的に日本語にしてみてください。 //- 当日は,Zoomでの開催になりますので,可能でしたら,別途Zoom用のPCやタブレットがあると受講しやすくなると思います(もちろん,なくても受講に支障がないようにします)。 - ご不明な点があれば,担当者までご連絡下さい。 *2.コーパスの利用申請 [#xada9e46] 講習会当日は,次の2種類のコーパスを利用します。これらの利用には,それぞれのコーパスのホームページから利用申請が必要となります。 -[[『日本語学習者作文コーパス』>http://sakubun.jpn.org/]] -- ページ下方の「【初めての方】利用者登録をする」をクリックして,利用者登録してください。 -[[『小中高大生による日本語絵描写ストーリーライティングコーパス(JASWRIC)』>https://language.sakura.ne.jp/jaswric/]] -- JASWRICのホームページの[[JASWRICダウンロード版の入手方法>https://language.sakura.ne.jp/jaswric/#download]]にしたがって,利用申請とコーパスデータ(data.zip)のダウンロードを行ってください。 -- 利用者申請すると取得できるパスワードを使って,コーパスデータ(data.zip)をデスクトップなど使いやすい場所に展開しておいてください。 #br 利用申請を行ったことを確認するため,お手数ですが,申請が完了しましたら,[[確認フォーム>https://forms.office.com/r/FwsWyYJkXp]]からお知らせください。 * 3.ツールのインストール(Windows の場合)[#k854af25] ** 3.1 Windowsの場合 [#a6b866a1] *** 3.1.1『ひまわり』のインストール [#h36d4bfc] ([[チュートリアルビデオ>https://youtu.be/KMlIZiZj8JY]]) + 『ひまわり』(ver.1.7.3) を国語研のサイトからダウンロードして下さい。 -- [[himawari_1_7_3.zip>https://csd.ninjal.ac.jp/archives/Himawari/himawari_1_7_3.zip]] + himawari_1_7_3.zip を展開(解凍)し,Himawari_1_7_3 というフォルダ(以後,『ひまわり』フォルダ)があることを確認して下さい。 + 『ひまわり』フォルダを,デスクトップなど操作しやすい場所に移動して下さい。すでに『ひまわり』をインストールしている場合は,インストール済みの資料への影響を考慮し,講習会用の『ひまわり』を別途用意しておくことをおすすめします。 + 『ひまわり』フォルダの中の himawari.exe をダブルクリックしてください。 -- Windows の設定によっては,himawari とだけしか表示されない場合もあります。このアイコン&ref(./himawari_icon.png,10%);を目印にしてください。 -- なお,32ビット版のWindowsを使用している場合,himawari.exe を実行すると,エラーがでます。himawari32.exe を利用してください。 //#br //#ref(pub/lesson20190727/himawari_exe.png,wrap,60%,center) //#br + 『ひまわり』が起動すれば,インストールは完了です。 //#br //#ref(pub/lesson20190727/himawari_up.png,80%,center) *** 3.1.2 MeCabのインストール [#qa579082] ([[チュートリアルビデオ>https://youtu.be/XoZKt-5Qp6I]]) + MeCab の配布サイトから,Binary package for MS-Windowsをダウンロード -- [[mecab-0.996.exe>https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7WElGUGt6ejlpVXc]] + ダウンロードしたファイルをダブルクリックし,MeCab をインストール -- インストール時の選択オプションは,すべてデフォルトでかまいません。 + デスクトップ上などにある MeCab のアイコンをダブルクリックして,MeCab を起動してください。黒いウィンドウが立ち上がるはずです。 + 漢字を含めた文字列を入力し,リターンキーを押してください。形態素解析されていれば,OK です。 *** 3.1.3 Unidicと『日本語学習者作文コーパス』のインストール [#i1ac38c9] //#br //CENTER:■■■■■Windows のかたは,以上で終了です■■■■■ //CENTER:■■■■■[[4.その他>#ubf006dd]]にお知らせなどがないか,ご確認ください。■■■■■ //#br //#br ** 3.2 ツールのインストール(macOSの場合) [#vf61c720] *** 3.2.1『ひまわり』のインストール [#h36d4bfc] ([[チュートリアルビデオ>https://youtu.be/EaT9X3MxN_o]]) + 『ひまわり』(ver.1.7.3) を国語研のサイトからダウンロードして下さい。 -- [[himawari_1_7_3.dmg>https://csd.ninjal.ac.jp/archives/Himawari/himawari_1_7_3.dmg]] + ダウンロードしたファイルをダブルクリックして,インストールしてください。 -- &color(red){すでに,『ひまわり』をインストールしている場合};は,既存の『ひまわり』に影響を与えるのを避けるため,新規にインストールしてください。その際,『ひまわり』を「Applications」フォルダではなく,デスクトップなどにドラッグ&ドロップしてください。 + 『ひまわり』が起動することを確認してください。 *** 3.2.2 brew のインストール(MeCab のインストールに必要) [#xba0aca4] ([[チュートリアルビデオ>https://youtu.be/mrzPAQOkRlA]]) [[brew>https://brew.sh/index_ja]]は,macOS用のソフトウェアパッケージの管理をするためのソフトウェアです。次の手順で,インストールしてください。 + インターネットに接続していることを確認 + 「ターミナル」を起動 -- [アプリケーション]⇒[ユーティリティ]⇒「ターミナル」 + 次のコマンドをコピーし,ターミナルにペースト([編集]⇒[ペースト])してください。リターンキーを押すと,コマンドが実行されます。 /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)" + "Press RETURN to continue or any other key to abort" と表示されるので,リターンキーを押してください。 + "Password:" と表示されるので,管理者用のパスワードを入力し,リターンキーを押してください(パスワードは表示されません)。 + 少し待つと(環境によっては10分程度),"Installation successful!", "Next steps:" などと表示されて,brew のインストールが終了します。 なお,本講習会後,brew をアンインストールする場合は,インストール時と同じように,ターミナルから次のコマンドを実行してください。brewとインストールしたパッケージが削除されます。 /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/uninstall.sh)" *** 3.2.3 MeCab のインストール [#kca3b12d] ([[チュートリアルビデオ>https://youtu.be/mrzPAQOkRlA]]) + インターネットに接続していることを確認 + 次のコマンドをコピーし,ターミナルにペーストしてください。リターンキーを押すと,MeCabとipadicがインストールされます。 brew install mecab mecab-ipadic + 次のコマンドをコピーし,ターミナルにペーストしてください。リターンキーを押して,"mecab of 0.996" と表示されれば,MeCabのインストールは完了です。 mecab --version * 4.各種データの準備 [#ld9c3a07] ** 4.1 UniDicと『日本語学習者作文コーパス』のインストール [#s71069ee] +『ひまわり』を起動してください。 +『ひまわり』用[[UniDicパッケージ>https://csd.ninjal.ac.jp/archives/Himawari/himawari_unidic_20221215.zip]]をダウンロードして,起動している『ひまわり』にドラッグ&ドロップしてください。 +『ひまわり』用[[『日本語学習者作文コーパス』パッケージ>]]をダウンロードして,起動している『ひまわり』にドラッグ&ドロップしてください。 ** 4.2 当日配布資料 [#z76b95c6] (準備中) //** 4.1 『日本語話し言葉コーパス』サンプルデータのインストール [#n1a67172] // 次の手順で,『日本語話し言葉コーパス』サンプルデータをインストールしてください。 //+ [[配布ページ>https://www2.ninjal.ac.jp/lrc/index.php?%C1%B4%CA%B8%B8%A1%BA%F7%A5%B7%A5%B9%A5%C6%A5%E0%A1%D8%A4%D2%A4%DE%A4%EF%A4%EA%A1%D9/%A5%C0%A5%A6%A5%F3%A5%ED%A1%BC%A5%C9/CSJ%A5%B5%A5%F3%A5%D7%A5%EB%A5%C7%A1%BC%A5%BF]]からパッケージをダウンロードしてください。 //-- [[himawari_csj_sample_20210217.zip>https://csd.ninjal.ac.jp/archives/Himawari/himawari_csj_sample_20210217.zip]] //+ 起動している『ひまわり』に,ダウンロードしたファイルをドラッグ&ドロップしてください。 //+ 「インストールが終了しました」と表示されれば,インストールは完了です。 //** 4.2 日本語諸方言コーパス (COJADS) [#mbe1560d] // 日本語諸方言コーパス (COJADS)のデータをダウンロードしておいていただく予定でしたが,配布サイトで新データの追加があり,『ひまわり』で扱えないデータが含まれるようになっています。現在調整中のようですので,動作の確認が取れしだい,別途ご連絡いたします。 // 『日本語諸方言コーパス』(COJADS)のCSVデータをダウンロード・展開しておいてください。 //+%% [[データDL>https://www2.ninjal.ac.jp/cojads/index.html?targ=data]]から「一括ダウンロード,UTF8,ZIP」で,CSVデータをダウンロードし,展開してください。%% //-- &color(red){配布サイトで新データの追加があり,『ひまわり』で扱えないデータが含まれるようになっています。現在調整中のようですので,利用規約を読んでおいてください。}; //+ 「研究成果の公表等に際しては、モニター版の利用規約に準ずる」ことが求められます。必要に応じて,[[利用方法>https://www2.ninjal.ac.jp/cojads/index.html?targ=howto]]の[[「日本語諸方言コーパス」モニター版利用規約>https://chunagon.ninjal.ac.jp/static/COJADS_TermsOfService.pdf]]をよくお読みください。 // 次の手順で,『日本語諸方言コーパス』(COJADS)のCSVデータをダウンロード・展開しておいてください。 //+ 「研究成果の公表等に際しては、モニター版の利用規約に準ずる」ことが求められますので,[[利用方法>https://www2.ninjal.ac.jp/cojads/index.html?targ=howto]]の[[「日本語諸方言コーパス」モニター版利用規約>https://chunagon.ninjal.ac.jp/static/COJADS_TermsOfService.pdf]]をよくお読みください。 //+%% [[データDL>https://www2.ninjal.ac.jp/cojads/index.html?targ=data]]から「一括ダウンロード,UTF8,ZIP」で,CSVデータをダウンロードし,展開してください。%% //-- &color(red){新データの追加があり,『ひまわり』で扱えないデータが含まれるようになっています。現在調整中のようですので,利用規約を読んでおいてください。}; //** 4.3 当日使用する資料 [#xfd09c48] // 別途配布する予定です。 * 5.その他 [#ubf006dd] - [[チュートリアル一覧>https://www2.ninjal.ac.jp/lrc/index.php?%C1%B4%CA%B8%B8%A1%BA%F7%A5%B7%A5%B9%A5%C6%A5%E0%A1%D8%A4%D2%A4%DE%A4%EF%A4%EA%A1%D9/%A5%D3%A5%C7%A5%AA%A5%C1%A5%E5%A1%BC%A5%C8%A5%EA%A5%A2%A5%EB]] ... 事前学習にご活用ください