#author("2022-03-15T10:18:37+09:00","default:rd","rd") [[講習会/第13回コーパス利用講習会]] [[pub/lesson20210827]] #author("2022-03-15T10:18:50+09:00","default:rd","rd") //&size(20){&color(red){本ページは構築中です。};}; CENTER:&size(20){全文検索システム『ひまわり』講習会 事前資料}; //CENTER:&size(18){「既存のテキストを『ひまわり』で検索してみよう」}; #br #br RIGHT:2021-08-19 RIGHT:山口昌也(国語研究所) #br #br * 1.概要 [#wbe389b4] - 事前準備として,『ひまわり』などのツールのインストールを行います。 - 準備を行う前に,次のことを確認してください。 -- 事前準備は,講習会当日使用するPCをインターネットに接続して,行なって下さい。 -- インストール先 PC の OSは,Windows,macOS を想定しています。これ以外のOSを利用することになった方は,事前にご相談ください。 -- また,Windowsで言語設定を日本語以外にしていて,問題が出るようでしたら,言語設定を一時的に日本語にしてみてください。 //- 当日は,Zoomでの開催になりますので,可能でしたら,別途Zoom用のPCやタブレットがあると受講しやすくなると思います(もちろん,なくても受講に支障がないようにします)。 - ご不明な点があれば,担当者までご連絡下さい。 //** 当日配布資料(スライド,実習用データなど) [#ue505a49] //- [[himawari_lesson20210305_rev01.zip>https://csd.ninjal.ac.jp/archives/Resources/himawari_lesson20210305_rev01.zip]] (一般公開用に一部修正) * 2.ツールのインストール(Windows の場合)[#k854af25] ** 2.1『ひまわり』のインストール [#h36d4bfc] ([[チュートリアルビデオ>https://youtu.be/Mx-eSN3IzkA]]) + 『ひまわり』(ver.1.6.10) を国語研のサイトからダウンロードして下さい。 -- [[himawari_1_6_10.zip>https://csd.ninjal.ac.jp/archives/Himawari/himawari_1_6_10.zip]] + himawari_1_6_10.zip を展開(解凍)し,Himawari_1_6_10 というフォルダ(以後,『ひまわり』フォルダ)があることを確認して下さい。 + 『ひまわり』フォルダを,デスクトップなど操作しやすい場所に移動して下さい。すでに『ひまわり』をインストールしている場合は,インストール済みの資料への影響を考慮し,講習会用の『ひまわり』を別途用意しておくことをおすすめします。 + 『ひまわり』フォルダの中の himawari.exe をダブルクリックしてください。 -- Windows の設定によっては,himawari とだけしか表示されない場合もあります。このアイコン&ref(pub/tutorial20160618/himawari_chan_64.png,40%);を目印にしてください。 -- なお,32ビット版のWindowsを使用している場合,himawari.exe を実行すると,エラーがでます。himawari32.exe を利用してください。 //#br //#ref(pub/lesson20190727/himawari_exe.png,wrap,60%,center) //#br + 『ひまわり』が起動すれば,インストールは完了です。 //#br //#ref(pub/lesson20190727/himawari_up.png,80%,center) ** 2.2 MeCabのインストール [#qa579082] ([[チュートリアルビデオ>https://youtu.be/XoZKt-5Qp6I]]) + MeCab の配布サイトから,Binary package for MS-Windowsをダウンロード -- [[mecab-0.996.exe>https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7WElGUGt6ejlpVXc]] + ダウンロードしたファイルをダブルクリックし,MeCab をインストール -- インストール時の選択オプションは,すべてデフォルトでかまいません。 + デスクトップ上などにある MeCab のアイコンをダブルクリックして,MeCab を起動してください。黒いウィンドウが立ち上がるはずです。 + 漢字を含めた文字列を入力し,リターンキーを押してください。形態素解析されていれば,OK です。 ** 2.3 サクラエディタのインストール [#i11c44fe] [[サクラエディタ>https://sakura-editor.github.io/]]をインストールしてください。なお,文字コード UTF-16 (Little Endian,BOM付き),改行コードLFでファイルを保存できるテキストエディタであれば,別のテキストエディタでもかまいませんが,念のため,サクラエディタもインストールしておくことをおすすめします。 + サクラエディタの配布サイトから ver.2.4.1をダウンロード -- [[sakura-tag-v2.4.1-build2849-ee8234f-Win32-Release-Installer.zip>https://github.com/sakura-editor/sakura/releases/download/v2.4.1/sakura-tag-v2.4.1-build2849-ee8234f-Win32-Release-Installer.zip]] + ダウンロードしたファイルを展開(解凍)するとインストーラがありますので,ダブルクリックして,インストールして下さい。 #br CENTER:■■■■■Windows のかたは,以上で終了です■■■■■ CENTER:■■■■■[[4.その他>#ubf006dd]]にお知らせなどがないか,ご確認ください。■■■■■ #br #br * 3.ツールのインストール(macOSの場合) [#vf61c720] ** 3.1『ひまわり』のインストール [#h36d4bfc] ([[チュートリアルビデオ>https://youtu.be/EaT9X3MxN_o]]) + 『ひまわり』(ver.1.6.10) を国語研のサイトからダウンロードして下さい。 -- [[himawari_1_6_10.dmg>https://csd.ninjal.ac.jp/archives/Himawari/himawari_1_6_10.dmg]] + ダウンロードしたファイルをダブルクリックして,インストールしてください。 -- &color(red){すでに,『ひまわり』をインストールしている場合};は,既存の『ひまわり』に影響を与えるのを避けるため,新規にインストールしてください。その際,『ひまわり』を「Applications」フォルダではなく,デスクトップなどにドラッグ&ドロップしてください。 + 『ひまわり』が起動することを確認してください。 ** 3.2 brew のインストール(MeCab のインストールに必要) [#xba0aca4] ([[チュートリアルビデオ>https://youtu.be/mrzPAQOkRlA]]) [[brew>https://brew.sh/index_ja]]は,macOS用のソフトウェアパッケージの管理をするためのソフトウェアです。次の手順で,インストールしてください。 + インターネットに接続していることを確認 + 「ターミナル」を起動 -- [アプリケーション]⇒[ユーティリティ]⇒「ターミナル」 + 次のコマンドをコピーし,ターミナルにペースト([編集]⇒[ペースト])してください。リターンキーを押すと,コマンドが実行されます。 /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)" + "Press RETURN to continue or any other key to abort" と表示されるので,リターンキーを押してください。 + "Password:" と表示されるので,管理者用のパスワードを入力し,リターンキーを押してください(パスワードは表示されません)。 + 少し待つと(環境によっては10分程度),"Installation successful!", "Next steps:" などと表示されて,brew のインストールが終了します。 なお,本講習会後,brew をアンインストールする場合は,インストール時と同じように,ターミナルから次のコマンドを実行してください。brewとインストールしたパッケージが削除されます。 /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/uninstall.sh)" ** 3.3 MeCab のインストール [#kca3b12d] ([[チュートリアルビデオ>https://youtu.be/mrzPAQOkRlA]]) + インターネットに接続していることを確認 + 次のコマンドをコピーし,ターミナルにペーストしてください。リターンキーを押すと,MeCabとipadicがインストールされます。 brew install mecab mecab-ipadic + 次のコマンドをコピーし,ターミナルにペーストしてください。リターンキーを押して,"mecab of 0.996" と表示されれば,MeCabのインストールは完了です。 mecab --version ** 3.4 テキストエディタ mi のインストール [#p44000e0] mi をインストールしてください。なお,文字コード UTF-16 (Little Endian,BOM付き),改行コードLFでファイルを保存できるテキストエディタであれば,別のテキストエディタでもかまいませんが,念のため,miもインストールしておくことをおすすめします。 + mi の配布サイトから ver.3.5.3 (最新バージョン)をダウンロード -- [[mi バージョン 3.5.3>https://www.mimikaki.net/download/mi3.5.3.dmg]] + ダウンロードしたファイルをダブルクリックして,インストールして下さい。 //** 3.5 Firefox のインストール [#c2644f6a] // [[Firefox>https://www.mozilla.org/ja/]]をインストールしてください。 //* 4.各種データの準備 [#ld9c3a07] //** 4.1 『日本語話し言葉コーパス』サンプルデータのインストール [#n1a67172] // 次の手順で,『日本語話し言葉コーパス』サンプルデータをインストールしてください。 //+ [[配布ページ>https://www2.ninjal.ac.jp/lrc/index.php?%C1%B4%CA%B8%B8%A1%BA%F7%A5%B7%A5%B9%A5%C6%A5%E0%A1%D8%A4%D2%A4%DE%A4%EF%A4%EA%A1%D9/%A5%C0%A5%A6%A5%F3%A5%ED%A1%BC%A5%C9/CSJ%A5%B5%A5%F3%A5%D7%A5%EB%A5%C7%A1%BC%A5%BF]]からパッケージをダウンロードしてください。 //-- [[himawari_csj_sample_20210217.zip>https://csd.ninjal.ac.jp/archives/Himawari/himawari_csj_sample_20210217.zip]] //+ 起動している『ひまわり』に,ダウンロードしたファイルをドラッグ&ドロップしてください。 //+ 「インストールが終了しました」と表示されれば,インストールは完了です。 //** 4.2 日本語諸方言コーパス (COJADS) [#mbe1560d] // 日本語諸方言コーパス (COJADS)のデータをダウンロードしておいていただく予定でしたが,配布サイトで新データの追加があり,『ひまわり』で扱えないデータが含まれるようになっています。現在調整中のようですので,動作の確認が取れしだい,別途ご連絡いたします。 // 『日本語諸方言コーパス』(COJADS)のCSVデータをダウンロード・展開しておいてください。 //+%% [[データDL>https://www2.ninjal.ac.jp/cojads/index.html?targ=data]]から「一括ダウンロード,UTF8,ZIP」で,CSVデータをダウンロードし,展開してください。%% //-- &color(red){配布サイトで新データの追加があり,『ひまわり』で扱えないデータが含まれるようになっています。現在調整中のようですので,利用規約を読んでおいてください。}; //+ 「研究成果の公表等に際しては、モニター版の利用規約に準ずる」ことが求められます。必要に応じて,[[利用方法>https://www2.ninjal.ac.jp/cojads/index.html?targ=howto]]の[[「日本語諸方言コーパス」モニター版利用規約>https://chunagon.ninjal.ac.jp/static/COJADS_TermsOfService.pdf]]をよくお読みください。 // 次の手順で,『日本語諸方言コーパス』(COJADS)のCSVデータをダウンロード・展開しておいてください。 //+ 「研究成果の公表等に際しては、モニター版の利用規約に準ずる」ことが求められますので,[[利用方法>https://www2.ninjal.ac.jp/cojads/index.html?targ=howto]]の[[「日本語諸方言コーパス」モニター版利用規約>https://chunagon.ninjal.ac.jp/static/COJADS_TermsOfService.pdf]]をよくお読みください。 //+%% [[データDL>https://www2.ninjal.ac.jp/cojads/index.html?targ=data]]から「一括ダウンロード,UTF8,ZIP」で,CSVデータをダウンロードし,展開してください。%% //-- &color(red){新データの追加があり,『ひまわり』で扱えないデータが含まれるようになっています。現在調整中のようですので,利用規約を読んでおいてください。}; //** 4.3 当日使用する資料 [#xfd09c48] // 別途配布する予定です。 * 4.その他 [#ubf006dd] - [[チュートリアル一覧>https://www2.ninjal.ac.jp/lrc/index.php?%C1%B4%CA%B8%B8%A1%BA%F7%A5%B7%A5%B9%A5%C6%A5%E0%A1%D8%A4%D2%A4%DE%A4%EF%A4%EA%A1%D9/%A5%D3%A5%C7%A5%AA%A5%C1%A5%E5%A1%BC%A5%C8%A5%EA%A5%A2%A5%EB]] ... 事前学習にご活用ください