国語研究所の施設整備に伴い,関連のサービスを次の期間,停止します。
期間:2024年4月27日(土)9:00~2024年4月29日(月・祝)17:30
対象:Web用例データベース(複合動詞,サ変動詞,形容詞)・『ひまわり』&関連資料(ダウンロードもできません),FishWatchr & FishWatchr Miniなど
#author("2020-10-11T05:39:04+00:00","default:rd","rd") #author("2020-10-11T05:43:09+00:00","default:rd","rd") [[全文検索システム『ひまわり』]] &size(20){&color(red){本ページは現在構築中です};}; &size(20){&color(red){本ページの内容は実験的なものです};}; * 1.概要 [#p126ba21] このページでは,[[BNCコーパス>http://www.natcorp.ox.ac.uk/]] (XML edition) のXMLデータを『ひまわり』で利用する方法について説明します。 このページでは,[[BNCコーパス>http://www.natcorp.ox.ac.uk/]] (XML edition) のXMLデータを『ひまわり』で利用する方法について説明します。本ページの内容は,英語コーパスに『ひまわり』を適用する,実験的なものです。&color(red){そのため,次の点をご承知おきください。}; -- BNCコーパスの書き言葉部分のみを扱います。 -- 変換処理に2時間以上かかります。 -- 本ページの内容を利用することにより直接的,間接的に生じたいかなる損害についても,保証しません。 なお,本ページの内容を利用することにより直接的,間接的に生じたいかなる損害についても,保証しません。 また,本ページの内容は,英語コーパスに『ひまわり』を適用する,実験的なものです。 * 2.準備 [#a003392e] //([[ビデオチュートリアル>https://youtu.be/URmnO7XTWeo]]も用意しました。[[チュートリアル一覧>全文検索システム『ひまわり』/ビデオチュートリアル]]も参照してください) + PC -- Windows10(64ビット版) -- メモリは8GB以上あることが望ましいです。 -- 残りディスク容量は,20GB程度必要になります。SSDなどの高速なディスクを使うことが望ましいです。 + 『ひまわり』(ver.1.6.7以上)をインストールしてください。 + [[British National Corpus, XML edition>https://ota.bodleian.ox.ac.uk/repository/xmlui/handle/20.500.12024/2554]]の「Download all local files for this item」ボタンを押して,Zipファイルをダウンロード・展開(解凍)してください。 + 展開したファイルに含まれる 2554.zip を展開(解凍)してください。この中に,downloadフォルダがあることを確認してください。 + 変換パッケージをダウロード・展開(解凍)してください。 + 展開後の変換パッケージの中にある次のファイルをBNCのdownloadフォルダにコピーし,実行してください。 -- Windows の場合,const_bnc_w_windows.bat (末尾の.batは表示されない場合もあります)をコピー後,ダブルクリックします。 -- それ以外の場合は,const_bnc_w_others.sh をコピーし,実行してください。 + 実行が完了すると,downloadフォルダの中にBNC_WRITTENというフォルダが作成され,書き言葉のデータだけがこのフォルダの中に移動されます。フォルダのプロパティを見るなどして,3141個のファイルが格納されていることを確認してください。 *3 変換手順 [#ka191cce] + 『ひまわり』を起動してください。 + 変換パッケージのZipファイルを『ひまわり』にドラッグ&ドロップしてください。変換用のスクリプトなどが『ひまわり』にインストールされます。 + 起動している『ひまわり』に BNC_WRITTEN フォルダをドラッグ&ドロップして,BNCのXMLファイルを『ひまわり』にインポートします。 -- 次のウィンドウが立ち上がったら,「詳細オプション」を押してください。 -- 赤枠の部分のように設定して,ウィンドウ下部の「インポート」ボタンを押してください。 + インポートが開始されます。インポートが終了すると,3141個のファイルがインポートされたと表示されるはずです。 -- この処理には,15分程度分(Intel Corei5 2GHzx4,メモリ6GB,SSD,Windows10の場合)かかります。 -- Windowsの場合,インポートの経過は,黒いウィンドウに表示されます。 + 『ひまわり』上部のメニューから[ツール]→[構築]→[インデックス生成]を実行してください。 -- この処理には,90分程度(同上)かかります。 -- Windowsの場合,インデックス作成の過程は,黒いウィンドウに表示されます。