本ページは,現在構築中です。
『日本語日常会話コーパス』(CEJC)のモニター公開版には,『ひまわり』用パッケージが同梱されています。本ページでは,『ひまわり』用パッケージの利用方法を説明します。本パッケージの特徴は,次のとおりです。
ここでは,『日本語話し言葉コーパス』データに固有の事柄について説明します。『ひまわり』自体の一般的な使い方については,利用者マニュアルをご覧ください。また,検索結果のデータの見方については,次のマニュアルを参照してください。なお,閲覧には,Adobe 社の Adobe Reader が必要です。Adobe 社の Web ページで無償配布しています。
マニュアル(2.3節)を参照して,『ひまわり』を起動して下さい。
『ひまわり』を起動すると,すぐに『日本語話し言葉コーパス』が検索対象となります。
『日本語話し言葉コーパス』用の設定ファイルは,config.xml (config_csj_all.xml と同一) です。このファイルを[ファイル]→[新規]で読み込むと,『日本語話し言葉コーパス』が検索対象になります。
コーパス選択機能を用いて,サブコーパスを選択します。なお,サブコーパス名の略号(例:「A01」)については,『日本語話し言葉コーパス』の概観の「2.8 ファイルの命名」,および,音声収録作業の概要をご覧ください。
#ref(): File not found: "search_target.png" at page "a"
次の項目を対象として,検索することができます。利用者マニュアルの4.1 節もあわせてご覧ください。
検索例1a | 検索例1b |
&ref(): File not found: "full_text_simple.png" at page "a"; | &ref(): File not found: "full_text_fc.png" at page "a"; |
検索例2a | 検索例2b | 検索例2c |
&ref(): File not found: "search_example1.png" at page "a"; | &ref(): File not found: "search_example2.png" at page "a"; | &ref(): File not found: "search_example3.png" at page "a"; |
検索例3a | 検索例3b |
&ref(): File not found: "pos_simple.png" at page "a"; | &ref(): File not found: "pos_pf.png" at page "a"; |
検索例4a | 検索例4b | 検索例4c |
&ref(): File not found: "daihyo_simple.png" at page "a"; | &ref(): File not found: "daihyo_p.png" at page "a"; | &ref(): File not found: "daihyo_pf.png" at page "a"; |
検索例5a | 検索例5b |
&ref(): File not found: "setu_simple.png" at page "a"; | &ref(): File not found: "setu_pf.png" at page "a"; |
検索結果には,次の情報が含まれます。「短単位・長単位データマニュアル」の3.2節も合わせて参照して下さい。
列名 | 備考 |
---|---|
前文脈 | |
出現形(検索文字列) | |
後文脈 | |
代表表記 | 短単位の情報 「活用型」「その他1」〜「その他3」は,短単位・長単位データマニュアル」の「活用の種類」,「その他の情報1」〜「その他の情報3」に対応 |
代表形 | |
品詞 | |
活用形 | |
活用型 | |
その他1 | |
その他2 | |
その他3 | |
発音形 | |
代表表記(長) | 長単位の情報 |
代表形(長) | |
品詞(長) | |
活用形(長) | |
活用型(長) | |
その他1(長) | |
その他2(長) | |
その他3(長) | |
出現形(後) | 後続する短単位の情報 |
代表表記(後) | |
代表形(後) | |
その他1(後) | |
出現形(前) | 前接する短単位の情報 |
代表表記(前) | |
代表形(前) | |
その他1(前) | |
講演ID | 当該の転記基本単位の情報 |
開始時間 | |
終了時間 | |
コア | 当該の転記テキストがコアに含まれるか否かを表すフラグ T: 含む場合T,F:含まない場合 |
検索結果(「品詞」「活用形」欄を除く)をダブルクリックすると,当該の検索文字列を含んだ転記テキストを閲覧することができます。
#ref(): File not found: "csj_manual_sample_browse.png" at page "a"
インストール時に音声データを『ひまわり』のフォルダにコピーしている場合,検索結果をダブルクリック(下記参照)すると,当該の検索文字列を含んだ転記単位の音声データを再生することができます。