[PukiWiki]

講習会/第13回コーパス利用講習会/事前準備 の変更点

Top/講習会/第13回コーパス利用講習会/事前準備

  • 追加された行はこの色です。
  • 削除された行はこの色です。
  • 講習会/第13回コーパス利用講習会/事前準備 へ行く。
  • 講習会/第13回コーパス利用講習会/事前準備 の差分を削除

#author("2022-03-15T10:18:37+09:00","default:rd","rd")
[[講習会/第13回コーパス利用講習会]]

[[pub/lesson20210827]]


#author("2022-03-15T10:18:50+09:00","default:rd","rd")
//&size(20){&color(red){本ページは構築中です。};};


CENTER:&size(20){全文検索システム『ひまわり』講習会 事前資料};
//CENTER:&size(18){「既存のテキストを『ひまわり』で検索してみよう」};

#br
#br
RIGHT:2021-08-19
RIGHT:山口昌也(国語研究所)
#br
#br

* 1.概要 [#wbe389b4]
- 事前準備として,『ひまわり』などのツールのインストールを行います。
- 準備を行う前に,次のことを確認してください。
-- 事前準備は,講習会当日使用するPCをインターネットに接続して,行なって下さい。
-- インストール先 PC の OSは,Windows,macOS を想定しています。これ以外のOSを利用することになった方は,事前にご相談ください。
-- また,Windowsで言語設定を日本語以外にしていて,問題が出るようでしたら,言語設定を一時的に日本語にしてみてください。
//- 当日は,Zoomでの開催になりますので,可能でしたら,別途Zoom用のPCやタブレットがあると受講しやすくなると思います(もちろん,なくても受講に支障がないようにします)。
- ご不明な点があれば,担当者までご連絡下さい。


//** 当日配布資料(スライド,実習用データなど) [#ue505a49]
//- [[himawari_lesson20210305_rev01.zip>https://csd.ninjal.ac.jp/archives/Resources/himawari_lesson20210305_rev01.zip]] (一般公開用に一部修正)

* 2.ツールのインストール(Windows の場合)[#k854af25]
** 2.1『ひまわり』のインストール [#h36d4bfc]

([[チュートリアルビデオ>https://youtu.be/Mx-eSN3IzkA]])

+ 『ひまわり』(ver.1.6.10) を国語研のサイトからダウンロードして下さい。
-- [[himawari_1_6_10.zip>https://csd.ninjal.ac.jp/archives/Himawari/himawari_1_6_10.zip]]
+ himawari_1_6_10.zip を展開(解凍)し,Himawari_1_6_10 というフォルダ(以後,『ひまわり』フォルダ)があることを確認して下さい。
+ 『ひまわり』フォルダを,デスクトップなど操作しやすい場所に移動して下さい。すでに『ひまわり』をインストールしている場合は,インストール済みの資料への影響を考慮し,講習会用の『ひまわり』を別途用意しておくことをおすすめします。
+ 『ひまわり』フォルダの中の himawari.exe をダブルクリックしてください。
-- Windows の設定によっては,himawari とだけしか表示されない場合もあります。このアイコン&ref(pub/tutorial20160618/himawari_chan_64.png,40%);を目印にしてください。
-- なお,32ビット版のWindowsを使用している場合,himawari.exe を実行すると,エラーがでます。himawari32.exe を利用してください。
//#br
//#ref(pub/lesson20190727/himawari_exe.png,wrap,60%,center)
//#br
+ 『ひまわり』が起動すれば,インストールは完了です。
//#br
//#ref(pub/lesson20190727/himawari_up.png,80%,center)

** 2.2 MeCabのインストール [#qa579082]
([[チュートリアルビデオ>https://youtu.be/XoZKt-5Qp6I]])

+ MeCab の配布サイトから,Binary package for MS-Windowsをダウンロード
-- [[mecab-0.996.exe>https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7WElGUGt6ejlpVXc]]
+ ダウンロードしたファイルをダブルクリックし,MeCab をインストール
-- インストール時の選択オプションは,すべてデフォルトでかまいません。
+ デスクトップ上などにある MeCab のアイコンをダブルクリックして,MeCab を起動してください。黒いウィンドウが立ち上がるはずです。
+ 漢字を含めた文字列を入力し,リターンキーを押してください。形態素解析されていれば,OK です。

** 2.3 サクラエディタのインストール [#i11c44fe]
 [[サクラエディタ>https://sakura-editor.github.io/]]をインストールしてください。なお,文字コード UTF-16 (Little Endian,BOM付き),改行コードLFでファイルを保存できるテキストエディタであれば,別のテキストエディタでもかまいませんが,念のため,サクラエディタもインストールしておくことをおすすめします。
 
+ サクラエディタの配布サイトから ver.2.4.1をダウンロード
-- [[sakura-tag-v2.4.1-build2849-ee8234f-Win32-Release-Installer.zip>https://github.com/sakura-editor/sakura/releases/download/v2.4.1/sakura-tag-v2.4.1-build2849-ee8234f-Win32-Release-Installer.zip]]
+ ダウンロードしたファイルを展開(解凍)するとインストーラがありますので,ダブルクリックして,インストールして下さい。


#br
CENTER:■■■■■Windows のかたは,以上で終了です■■■■■
CENTER:■■■■■[[4.その他>#ubf006dd]]にお知らせなどがないか,ご確認ください。■■■■■
#br
#br
 
* 3.ツールのインストール(macOSの場合) [#vf61c720]
** 3.1『ひまわり』のインストール [#h36d4bfc]

([[チュートリアルビデオ>https://youtu.be/EaT9X3MxN_o]])

+ 『ひまわり』(ver.1.6.10) を国語研のサイトからダウンロードして下さい。
-- [[himawari_1_6_10.dmg>https://csd.ninjal.ac.jp/archives/Himawari/himawari_1_6_10.dmg]]
+ ダウンロードしたファイルをダブルクリックして,インストールしてください。
-- &color(red){すでに,『ひまわり』をインストールしている場合};は,既存の『ひまわり』に影響を与えるのを避けるため,新規にインストールしてください。その際,『ひまわり』を「Applications」フォルダではなく,デスクトップなどにドラッグ&ドロップしてください。
+ 『ひまわり』が起動することを確認してください。


** 3.2 brew のインストール(MeCab のインストールに必要) [#xba0aca4]
([[チュートリアルビデオ>https://youtu.be/mrzPAQOkRlA]])

 [[brew>https://brew.sh/index_ja]]は,macOS用のソフトウェアパッケージの管理をするためのソフトウェアです。次の手順で,インストールしてください。

+ インターネットに接続していることを確認
+ 「ターミナル」を起動
-- [アプリケーション]⇒[ユーティリティ]⇒「ターミナル」
+ 次のコマンドをコピーし,ターミナルにペースト([編集]⇒[ペースト])してください。リターンキーを押すと,コマンドが実行されます。
 /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
+ "Press RETURN to continue or any other key to abort" と表示されるので,リターンキーを押してください。
+ "Password:" と表示されるので,管理者用のパスワードを入力し,リターンキーを押してください(パスワードは表示されません)。
+ 少し待つと(環境によっては10分程度),"Installation successful!", "Next steps:" などと表示されて,brew のインストールが終了します。

 なお,本講習会後,brew をアンインストールする場合は,インストール時と同じように,ターミナルから次のコマンドを実行してください。brewとインストールしたパッケージが削除されます。

 /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/uninstall.sh)"



** 3.3 MeCab のインストール [#kca3b12d]

([[チュートリアルビデオ>https://youtu.be/mrzPAQOkRlA]])

+ インターネットに接続していることを確認
+ 次のコマンドをコピーし,ターミナルにペーストしてください。リターンキーを押すと,MeCabとipadicがインストールされます。
 brew install mecab mecab-ipadic
+ 次のコマンドをコピーし,ターミナルにペーストしてください。リターンキーを押して,"mecab of 0.996" と表示されれば,MeCabのインストールは完了です。
 mecab --version


** 3.4 テキストエディタ mi のインストール [#p44000e0]
 mi をインストールしてください。なお,文字コード UTF-16 (Little Endian,BOM付き),改行コードLFでファイルを保存できるテキストエディタであれば,別のテキストエディタでもかまいませんが,念のため,miもインストールしておくことをおすすめします。

+ mi の配布サイトから ver.3.5.3 (最新バージョン)をダウンロード
-- [[mi バージョン 3.5.3>https://www.mimikaki.net/download/mi3.5.3.dmg]]
+ ダウンロードしたファイルをダブルクリックして,インストールして下さい。

//** 3.5 Firefox のインストール [#c2644f6a]
// [[Firefox>https://www.mozilla.org/ja/]]をインストールしてください。




//* 4.各種データの準備 [#ld9c3a07]
//** 4.1 『日本語話し言葉コーパス』サンプルデータのインストール [#n1a67172]

// 次の手順で,『日本語話し言葉コーパス』サンプルデータをインストールしてください。

//+ [[配布ページ>https://www2.ninjal.ac.jp/lrc/index.php?%C1%B4%CA%B8%B8%A1%BA%F7%A5%B7%A5%B9%A5%C6%A5%E0%A1%D8%A4%D2%A4%DE%A4%EF%A4%EA%A1%D9/%A5%C0%A5%A6%A5%F3%A5%ED%A1%BC%A5%C9/CSJ%A5%B5%A5%F3%A5%D7%A5%EB%A5%C7%A1%BC%A5%BF]]からパッケージをダウンロードしてください。
//-- [[himawari_csj_sample_20210217.zip>https://csd.ninjal.ac.jp/archives/Himawari/himawari_csj_sample_20210217.zip]]
//+ 起動している『ひまわり』に,ダウンロードしたファイルをドラッグ&ドロップしてください。
//+ 「インストールが終了しました」と表示されれば,インストールは完了です。

//** 4.2 日本語諸方言コーパス (COJADS) [#mbe1560d]

// 日本語諸方言コーパス (COJADS)のデータをダウンロードしておいていただく予定でしたが,配布サイトで新データの追加があり,『ひまわり』で扱えないデータが含まれるようになっています。現在調整中のようですので,動作の確認が取れしだい,別途ご連絡いたします。

// 『日本語諸方言コーパス』(COJADS)のCSVデータをダウンロード・展開しておいてください。

//+%% [[データDL>https://www2.ninjal.ac.jp/cojads/index.html?targ=data]]から「一括ダウンロード,UTF8,ZIP」で,CSVデータをダウンロードし,展開してください。%%
//-- &color(red){配布サイトで新データの追加があり,『ひまわり』で扱えないデータが含まれるようになっています。現在調整中のようですので,利用規約を読んでおいてください。};
//+ 「研究成果の公表等に際しては、モニター版の利用規約に準ずる」ことが求められます。必要に応じて,[[利用方法>https://www2.ninjal.ac.jp/cojads/index.html?targ=howto]]の[[「日本語諸方言コーパス」モニター版利用規約>https://chunagon.ninjal.ac.jp/static/COJADS_TermsOfService.pdf]]をよくお読みください。

// 次の手順で,『日本語諸方言コーパス』(COJADS)のCSVデータをダウンロード・展開しておいてください。

//+ 「研究成果の公表等に際しては、モニター版の利用規約に準ずる」ことが求められますので,[[利用方法>https://www2.ninjal.ac.jp/cojads/index.html?targ=howto]]の[[「日本語諸方言コーパス」モニター版利用規約>https://chunagon.ninjal.ac.jp/static/COJADS_TermsOfService.pdf]]をよくお読みください。
//+%% [[データDL>https://www2.ninjal.ac.jp/cojads/index.html?targ=data]]から「一括ダウンロード,UTF8,ZIP」で,CSVデータをダウンロードし,展開してください。%%
//-- &color(red){新データの追加があり,『ひまわり』で扱えないデータが含まれるようになっています。現在調整中のようですので,利用規約を読んでおいてください。};


//** 4.3 当日使用する資料 [#xfd09c48]
// 別途配布する予定です。


* 4.その他 [#ubf006dd]
- [[チュートリアル一覧>https://www2.ninjal.ac.jp/lrc/index.php?%C1%B4%CA%B8%B8%A1%BA%F7%A5%B7%A5%B9%A5%C6%A5%E0%A1%D8%A4%D2%A4%DE%A4%EF%A4%EA%A1%D9/%A5%D3%A5%C7%A5%AA%A5%C1%A5%E5%A1%BC%A5%C8%A5%EA%A5%A2%A5%EB]] ... 事前学習にご活用ください

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS