国語研究所の施設整備に伴い,関連のサービスを次の期間,停止します。
期間:2024年4月27日(土)9:00~2024年4月29日(月・祝)17:30
対象:Web用例データベース(複合動詞,サ変動詞,形容詞)・『ひまわり』&関連資料(ダウンロードもできません),FishWatchr & FishWatchr Miniなど
本ページは,現在構築中です。
『日本語話し言葉コーパス』(CSJ)は,第#刷から『ひまわり』(以後,「CSJ版『ひまわり』」)を同梱して配布されています。本ページでは,CSJ用『ひまわり』パッケージの利用方法を説明します。CSJ用『ひまわり』の特徴は,次のとおりです。
ここでは,『日本語話し言葉コーパス』データに固有の事柄について説明します。『ひまわり』自体の一般的な使い方については,利用者マニュアルをご覧ください。また,検索結果のデータの見方については,次のマニュアルを参照してください。なお,閲覧には,Adobe 社の Adobe Reader が必要です。Adobe 社の Web ページで無償配布しています。
マニュアル(2.3節)を参照して,『ひまわり』を起動して下さい。
『ひまわり』を起動すると,すぐに『日本語話し言葉コーパス』が検索対象となります。
『日本語話し言葉コーパス』用の設定ファイルは,config.xml (config_csj_all.xml と同一) です。このファイルを[ファイル]→[新規]で読み込むと,『日本語話し言葉コーパス』が検索対象になります。
コーパス選択機能を用いて,サブコーパスを選択します。なお,サブコーパス名の略号(例:「A01」)については,『日本語話し言葉コーパス』の概観の「2.8 ファイルの命名」,および,音声収録作業の概要をご覧ください。
次の項目を対象として,検索することができます。利用者マニュアルの4.1 節もあわせてご覧ください。
節境界情報をキーとして検索します。文字列の照合には,正規表現を使います。
検索結果には,次の情報が含まれます。「短単位・長単位データマニュアル」の3.2節も合わせて参照して下さい。
検索結果(「品詞」「活用形」欄を除く)をダブルクリックすると,当該の検索文字列を含んだ転記テキストを閲覧することができます。
インストール時に音声データを『ひまわり』のフォルダにコピーしている場合,検索結果をダブルクリック(下記参照)すると,当該の検索文字列を含んだ転記単位の音声データを再生することができます。