#author("2023-01-31T11:52:17+09:00","default:rd","rd") [[全文検索システム『ひまわり』]] &size(20){&color(red){作成中};}; RIGHT:作成者:山口昌也 (国立国語研究所) RIGHT:2023-02-xx(公開) #br * 1.概要 [#x0562e5e] このページでは,[[『日本語学習者作文コーパス』(以後,JLCC)>http://sakubun.jpn.org/]]を『ひまわり』で利用する方法について説明します。 なお,本ページの内容を利用することにより直接的,間接的に生じたいかなる損害についても,保証しません。 * 2.準備 [#a003392e] + 使用するPCでプログラミング言語Perlを使えるようにしてください。 -- 参考(Windowsの場合): [[Strawberry Perlのダウンロード及びインストール(Javadrive)>https://www.javadrive.jp/perl/activeperl/index4.html]] -- macOSにはデフォルトでインストールされています。 + [[『ひまわり』>全文検索システム『ひまわり』]]をインストールしてください。 + 変換パッケージをダウンロードし,展開してください。以後,展開したフォルダを変換Fとします。 //-- [[変換パッケージ>https://csd.ninjal.ac.jp/archives/Himawari/jaswric2himawari_20230125.zip]] (2023-01-25,[[履歴>./履歴]]) //-- [[GitHub>https://github.com/himawari-san/JASWRIC2Himawari]]にも公開しています。 + [[『日本語学習者作文コーパス』のHP>http://sakubun.jpn.org/]]を開き,「利用者登録」を行ってください。 +「[[使い方を見る>http://sakubun.jpn.org/howto/]]」のページを開き,「全文データをダウンロードする」から「data.zip」をダウンロード・展開し,次の処理をしてください。 -- morphフォルダを変換Fにコピー -- register.xlsをExcelで読み込み,[ファイル]→[名前をつけて保存]を実行し,「Unicodeテキスト」形式で保存してください。さらに,保存した結果(register.txt)を変換F中のScriptフォルダにコピーしてください。なお,Excel以外を用いる場合は,タブ区切り・UTF-16 BOMなしとなるよう,保存してください。 * 謝辞 [#o28ef02a] 有用な言語資源を公開してくださった「自然言語処理の技術を利用したタグ付き学習者作文コーパスの開発」科研グループに感謝いたします。