国語研究所の施設整備に伴い,関連のサービスを次の期間,停止します。
期間:2024年4月27日(土)9:00~2024年4月29日(月・祝)17:30
対象:Web用例データベース(複合動詞,サ変動詞,形容詞)・『ひまわり』&関連資料(ダウンロードもできません),FishWatchr & FishWatchr Miniなど
本ページは現在構築中です。
『日本語話し言葉コーパス』のXMLデータを『ひまわり』にインポートします。以下の手順で実行して下さい。
setup.bat ... Windows の場合 setup.command ... MacOS X の場合 setup.sh ... その他の場合(bash を利用)
java -jar himawari.jar
himawari_exec.bat ... Windows の場合 himawari_exec.command ... MacOS X の場合 himawari_exec.sh ... その他の場合(bash を利用)
以上で,データのインポートは終了です。CSJ2Himawari フォルダは削除してもかまいません。
ここでは,『日本語話し言葉コーパス』データに固有の事柄について説明します。『ひまわり』自体の一般的な使い方については,利用者マニュアルをご覧ください。また,検索結果のデータの見方については,次のマニュアルを参照してください。なお,閲覧には,Adobe 社の Adobe Reader が必要です。Adobe 社の Web ページで無償配布しています
『日本語話し言葉コーパス』用の設定ファイルは,config_csj_all.xml です。このファイルを[ファイル]→[新規]で読み込むと,『日本語話し言葉コーパス』が検索対象になります。なお,インポートした直後は,『日本語話し言葉コーパス』が検索対象になっています。
コーパス選択機能を用いて,サブコーパスを選択します。ここに現れるサブコーパスは,3節で配置したフォルダ構造と対応します。
次の項目を対象として,検索することができます。利用者マニュアルの4.1 節もあわせてご覧ください。
検索結果をダブルクリックすると,当該の検索文字列を含んだ転記テキストを閲覧することができます。