国語研究所の施設整備に伴い,関連のサービスを次の期間,停止します。
期間:2024年4月27日(土)9:00~2024年4月29日(月・祝)17:30
対象:Web用例データベース(複合動詞,サ変動詞,形容詞)・『ひまわり』&関連資料(ダウンロードもできません),FishWatchr & FishWatchr Miniなど
[[全文検索システム『ひまわり』/利用者マニュアル/1_5]] *5. 言語資料を『ひまわり』で検索できるようにする [#q7e09870] ** 5.1 一般的な手順 [#ldb6e87b] 『ひまわり』は,テキストファイル,HTML, XHTML,XML などさまざまな形式のテキストをインポートして,検索することができます。以下,順序をおって,一般的な操作手順を説明します。 *** 5.1.1 言語資料の準備 [#g2927b9f] まず,インポートする言語資料を一つのフォルダにまとめます。その際,ファイル名やフォルダ名に資料に対する情報を付けておくと便利です。下の例では, まず,インポートする言語資料を一つのフォルダにまとめます。フォルダの中にフォルダを作って,細かく分類しても,かまいません。ここでは,次のような構造でファイルを配置したものとします。 *** 5.1.2 インポートの実行 [#v9f285bd] 『ひまわり』のメニューから[ファイル]⇒[インポート]を実行します。次のウィンドウが現れたら,「参照」ボタンを押して,言語資料をまとめたフォルダを指定します。すると,自動的に指定したフォルダ名がコーパス名となります。 そのままでよければ,「インポート」ボタンを押してください。インポート処理が終わると,次のようなウィンドウがでれば,インポート完了です。 *** 5.1.3 言語資料の利用 [#n1f92a00] インポート直後から, //- 言語資料を用意する //- // ここでは,生のテキストをインポートしてみます。 ** 5.2 テキストファイルの場合 [#v9e1b6fa] HTML,XML などでタグ付けされていない,生のテキストファイルは,ファイル名やフォルダ名ディレクトリ一定の表記パターンの ** 5.2 言語資料を用意する [#jd6746ce] // 漢字コードを揃える。 // 単純にファイルを ** 5.3 変換する [#t3b41b04] 収集した言語資料を変換します。[ファイル]→[インポート]