目次
このページでは,『昭和話し言葉コーパス』 (以後,SSC) の全文検索『ひまわり』用パッケージSSCパッケージの利用方法を説明します。特徴は,次のとおりです。
なお,SSCパッケージは,SSCの配布データに含まれる転記テキスト,メタデータを『ひまわり』にインポートする形で構築しています。
パッケージのインストールが終了すると,SSCが検索できる状態になっています。検索できるかどうか,確認してください。検索するには,検索欄に適当な文字列を入力し,「検索」ボタンを押します。上の図は,「言葉」を検索した結果です。
検索結果の各列の説明は,次のとおりです。SSCのマニュアルもあわせて,参照して下さい。
列名 | 備考 |
---|---|
前文脈 | キーの前文脈 |
キー | 検索文字列 |
後文脈 | キーの後文脈 |
ファイルID | キーが出現したファイルのID |
話者ID | 当該発話の話者情報 |
氏名 | |
性別 | |
収録時年齢 | |
生年 | |
出身地 | |
居住地 | |
職業 | |
タイプ | 当該ファイルの情報 |
タイトル | |
録音年月 | |
開始時間 | 当該発話の開始時間 |
終了時間 | 当該発話の終了時間 |
品詞 | キーの先頭文字を含む語(短単位)の情報 |
活用型 | |
活用形 | |
語種 | |
語彙素 | |
語彙素読み | |
発音形出現形 | |
発音 | |
書字形 | |
タグ付き書字形 | |
語彙素-2 | 当該語の2語前の語彙素 |
語彙素-1 | 当該語の1語前の語彙素 |
語彙素1 | 当該語の1語後の語彙素 |
語彙素2 | 当該語の2語後の語彙素 |
Tier | 当該発話のTextGridデータにおける層 |
検索文字列欄の左のメニューから,検索対象を選択することができます。『ひまわり』利用者マニュアルの4.1 節もあわせてご覧ください。
検索結果(「ファイルID」「話者ID」「話者」「性別」「年齢」列を除く)をダブルクリックすると,当該の検索文字列を含んだ転記テキストを閲覧することができます。
本研究は,国立国語研究所共同研究プロジェクト「大規模日常会話コーパスに基づく話し言葉の多角的研究」の一環として行われました。
全文検索システム『ひまわり』の作成にあたっては,次のJSPS科研費の助成を受けています。