現在,本コンテンツは,保守されていません。
注意:
『日本語話し言葉コーパス』(CSJ)は,第4刷から『ひまわり』用CSJパッケージを同梱して配布されています。すでに,第1〜3刷を購入されている方は,無料で差分ファイルが提供されますので,そちらもご検討下さい。詳しくは,申し込み手順のページをご覧ください。
『日本語話し言葉コーパス』のXMLデータを『ひまわり』にインポートします。以下の手順で実行して下さい。
setup.bat ... Windows の場合 setup.command ... MacOS X の場合 setup.sh ... その他の場合(bash を利用)
java -jar himawari.jar
himawari_exec.bat ... Windows の場合 himawari_exec.command ... MacOS X の場合 himawari_exec.sh ... その他の場合(bash を利用)
以上で,データのインポートは終了です。『ひまわり』での動作が確認されれば,CSJ2Himawari フォルダは削除してもかまいません。
ここでは,『日本語話し言葉コーパス』データに固有の事柄について説明します。『ひまわり』自体の一般的な使い方については,利用者マニュアルをご覧ください。また,検索結果のデータの見方については,次のマニュアルを参照してください。なお,閲覧には,Adobe 社の Adobe Reader が必要です。Adobe 社の Web ページで無償配布しています
『日本語話し言葉コーパス』用の設定ファイルは,config_csj_all.xml です。このファイルを[ファイル]→[新規]で読み込むと,『日本語話し言葉コーパス』が検索対象になります。なお,インポートした直後は,『日本語話し言葉コーパス』が検索対象になっています。
コーパス選択機能を用いて,サブコーパスを選択します。ここに表示されるサブコーパスは,3節で配置したフォルダ構造と対応します。なお,サブコーパス名の略号(例:「A01」)については,『日本語話し言葉コーパス』の概観の「2.8 ファイルの命名」,および,音声収録作業の概要をご覧ください。
次の項目を対象として,検索することができます。利用者マニュアルの4.1 節もあわせてご覧ください。
検索結果をダブルクリックすると,当該の検索文字列を含んだ転記テキストを閲覧することができます。