全文検索システム『ひまわり』/BNCの利用
をテンプレートにして作成
開始行:
[[全文検索システム『ひまわり』]]
//&size(20){&color(red){本ページは現在構築中です};};
&size(20){&color(red){本ページの内容は実験的なものです};};
* 1.概要 [#p126ba21]
このページでは,[[BNCコーパス>http://www.natcorp.ox.ac....
-- BNCコーパスの書き言葉部分のみを扱います。
-- 『ひまわり』は日本語のコーパスの検索を目的に設計されて...
-- 変換処理に2時間半程度かかります。
-- 本ページの内容を利用することにより直接的,間接的に生じ...
* 2.準備 [#a003392e]
([[ビデオチュートリアル>https://youtu.be/URmnO7XTWeo]]も...
+ PC
-- Windowsの場合は,64ビット版を使うことが望ましい。動作...
-- メモリは8GB以上あることが望ましい。
-- 変換処理を含め,20GB程度のディスクを使用します。SSDな...
+ 『ひまわり』(ver.1.6.7以上)をインストールしてください。
+ [[British National Corpus, XML edition>https://ota.bodl...
-- BNC Consortium, 2007, British National Corpus, XML edi...
+ 展開したファイルに含まれる 2554.zip を展開(解凍)して...
+ 変換パッケージをダウロード・展開(解凍)してください。
-- [[変換パッケージ>https://csd.ninjal.ac.jp/archives/Him...
+ 展開後の変換パッケージの中にある次のファイルをBNCのdown...
-- Windows の場合,const_bnc_w_windows.bat (末尾の.batは...
-- それ以外の場合は,const_bnc_w.sh をコピーし,実行して...
+ 実行が完了すると,downloadフォルダの中にBNC_WRITTENとい...
*3 変換手順 [#ka191cce]
+ 『ひまわり』を起動してください。
+ 変換パッケージのZipファイルを『ひまわり』にドラッグ&ド...
+ 起動している『ひまわり』に BNC_WRITTEN フォルダをドラッ...
++ 次のウィンドウが立ち上がったら,「詳細オプション」を押...
#br
#ref(./bnc_import1a.png,85%)
#br
++ 赤枠の部分のように設定して,ウィンドウ下部の「インポー...
#br
#ref(./bnc_import3a.png,85%)
#br
+ インポートが開始されます。インポートが終了すると,3141...
-- この処理には,20分程度分(Intel Corei5 2GHzx4,メモリ6...
-- Windowsの場合,インポートの経過は,黒いウィンドウに表...
+ &color(red){再度,変換パッケージのZipファイルを『ひまわ...
+ 『ひまわり』上部のメニューから[ツール]→[構築]→[インデッ...
-- この処理には,100分程度(同上)かかります。
-- Windowsの場合,インデックス作成の過程は,黒いウィンド...
+ 「インデックス生成処理が正常に終了しました」と出れば,...
* 4.使い方 [#y71cb09f]
- 『ひまわり』上部のメニューから[ファイル]→[コーパス選択]...
- 『ひまわり』の使い方については, [[ビデオチュートリアル...
- 検索は基本的に単語検索のみです。
-- w/@hw, w/@pos, w/@c5 については,[[BNCのマニュアル>htt...
-- 文字列の照合は,完全一致です。
#br
#ref(./bnc_search1a.png,wrap,85%)
#br
- 検索結果例
-- 「t2」「-t2」などはそれぞれ検索語の2語後,2語前を表...
-- 検索結果をダブルクリックすると,当該の文書全体がWebブ...
#br
#ref(./bnc_search2.png,70%)
#br
* 5.その他 [#mf5f60b8]
- 品詞での検索や出現頻度が高い語を検索する場合は,「検索...
終了行:
[[全文検索システム『ひまわり』]]
//&size(20){&color(red){本ページは現在構築中です};};
&size(20){&color(red){本ページの内容は実験的なものです};};
* 1.概要 [#p126ba21]
このページでは,[[BNCコーパス>http://www.natcorp.ox.ac....
-- BNCコーパスの書き言葉部分のみを扱います。
-- 『ひまわり』は日本語のコーパスの検索を目的に設計されて...
-- 変換処理に2時間半程度かかります。
-- 本ページの内容を利用することにより直接的,間接的に生じ...
* 2.準備 [#a003392e]
([[ビデオチュートリアル>https://youtu.be/URmnO7XTWeo]]も...
+ PC
-- Windowsの場合は,64ビット版を使うことが望ましい。動作...
-- メモリは8GB以上あることが望ましい。
-- 変換処理を含め,20GB程度のディスクを使用します。SSDな...
+ 『ひまわり』(ver.1.6.7以上)をインストールしてください。
+ [[British National Corpus, XML edition>https://ota.bodl...
-- BNC Consortium, 2007, British National Corpus, XML edi...
+ 展開したファイルに含まれる 2554.zip を展開(解凍)して...
+ 変換パッケージをダウロード・展開(解凍)してください。
-- [[変換パッケージ>https://csd.ninjal.ac.jp/archives/Him...
+ 展開後の変換パッケージの中にある次のファイルをBNCのdown...
-- Windows の場合,const_bnc_w_windows.bat (末尾の.batは...
-- それ以外の場合は,const_bnc_w.sh をコピーし,実行して...
+ 実行が完了すると,downloadフォルダの中にBNC_WRITTENとい...
*3 変換手順 [#ka191cce]
+ 『ひまわり』を起動してください。
+ 変換パッケージのZipファイルを『ひまわり』にドラッグ&ド...
+ 起動している『ひまわり』に BNC_WRITTEN フォルダをドラッ...
++ 次のウィンドウが立ち上がったら,「詳細オプション」を押...
#br
#ref(./bnc_import1a.png,85%)
#br
++ 赤枠の部分のように設定して,ウィンドウ下部の「インポー...
#br
#ref(./bnc_import3a.png,85%)
#br
+ インポートが開始されます。インポートが終了すると,3141...
-- この処理には,20分程度分(Intel Corei5 2GHzx4,メモリ6...
-- Windowsの場合,インポートの経過は,黒いウィンドウに表...
+ &color(red){再度,変換パッケージのZipファイルを『ひまわ...
+ 『ひまわり』上部のメニューから[ツール]→[構築]→[インデッ...
-- この処理には,100分程度(同上)かかります。
-- Windowsの場合,インデックス作成の過程は,黒いウィンド...
+ 「インデックス生成処理が正常に終了しました」と出れば,...
* 4.使い方 [#y71cb09f]
- 『ひまわり』上部のメニューから[ファイル]→[コーパス選択]...
- 『ひまわり』の使い方については, [[ビデオチュートリアル...
- 検索は基本的に単語検索のみです。
-- w/@hw, w/@pos, w/@c5 については,[[BNCのマニュアル>htt...
-- 文字列の照合は,完全一致です。
#br
#ref(./bnc_search1a.png,wrap,85%)
#br
- 検索結果例
-- 「t2」「-t2」などはそれぞれ検索語の2語後,2語前を表...
-- 検索結果をダブルクリックすると,当該の文書全体がWebブ...
#br
#ref(./bnc_search2.png,70%)
#br
* 5.その他 [#mf5f60b8]
- 品詞での検索や出現頻度が高い語を検索する場合は,「検索...
ページ名: