[PukiWiki]

全文検索システム『ひまわり』/ダウンロード/『上方はなしコーパス』パッケージ の履歴(No.46)


  • 履歴一覧
  • 差分 を表示
  • 現在との差分 を表示
  • ソース を表示
  • 全文検索システム『ひまわり』/ダウンロード/『上方はなしコーパス』パッケージ へ行く。
    • 1 (2021-07-08 (木) 22:57:20)
    • 2 (2021-07-08 (木) 22:59:37)
    • 3 (2021-07-09 (金) 02:42:33)
    • 4 (2021-07-09 (金) 02:42:33)
    • 5 (2021-07-09 (金) 02:42:33)
    • 6 (2021-07-09 (金) 02:50:00)
    • 7 (2021-07-09 (金) 02:54:29)
    • 8 (2021-07-09 (金) 02:55:43)
    • 9 (2021-07-09 (金) 02:58:12)
    • 10 (2021-07-09 (金) 03:07:38)
    • 11 (2021-07-09 (金) 03:07:54)
    • 12 (2021-07-10 (土) 03:06:54)
    • 13 (2021-07-10 (土) 03:08:36)
    • 14 (2021-07-10 (土) 03:10:48)
    • 15 (2021-07-10 (土) 03:11:24)
    • 16 (2021-07-10 (土) 05:26:11)
    • 17 (2021-07-10 (土) 05:26:54)
    • 18 (2021-07-10 (土) 05:28:27)
    • 19 (2021-07-10 (土) 05:38:49)
    • 20 (2021-07-10 (土) 05:39:10)
    • 21 (2021-07-10 (土) 06:23:48)
    • 22 (2021-07-10 (土) 23:38:43)
    • 23 (2021-07-11 (日) 05:28:31)
    • 24 (2021-07-11 (日) 05:28:31)
    • 25 (2021-07-11 (日) 05:28:31)
    • 26 (2021-07-12 (月) 06:16:47)
    • 27 (2021-07-12 (月) 06:17:04)
    • 28 (2021-07-14 (水) 02:59:54)
    • 29 (2021-07-13 (火) 17:59:54)
    • 30 (2021-09-16 (木) 17:48:35)
    • 31 (2021-09-16 (木) 17:49:00)
    • 32 (2021-09-16 (木) 17:59:58)
    • 33 (2021-09-16 (木) 18:09:07)
    • 34 (2021-09-16 (木) 18:09:43)
    • 35 (2021-09-16 (木) 18:09:57)
    • 36 (2021-09-16 (木) 18:10:42)
    • 37 (2021-09-16 (木) 18:11:56)
    • 38 (2021-09-21 (火) 13:20:32)
    • 39 (2021-09-21 (火) 13:36:09)
    • 40 (2021-09-21 (火) 13:37:22)
    • 41 (2021-09-21 (火) 13:37:53)
    • 42 (2021-09-21 (火) 13:38:39)
    • 43 (2021-09-21 (火) 13:39:06)
    • 44 (2021-09-21 (火) 13:40:15)
    • 45 (2021-09-21 (火) 13:48:11)
    • 46 (2021-09-21 (火) 13:48:42)
    • 47 (2021-09-21 (火) 13:49:04)
    • 48 (2021-09-21 (火) 13:51:33)
    • 49 (2021-09-21 (火) 13:51:58)
    • 50 (2021-09-21 (火) 13:57:21)
    • 51 (2021-09-21 (火) 13:57:45)
    • 52 (2021-09-21 (火) 13:58:18)
    • 53 (2021-09-21 (火) 13:58:49)
    • 54 (2021-09-21 (火) 14:01:56)
    • 55 (2021-09-21 (火) 14:05:37)
    • 56 (2021-09-21 (火) 14:06:48)
    • 57 (2021-09-21 (火) 14:07:57)
    • 58 (2021-09-21 (火) 14:08:23)
    • 59 (2021-09-21 (火) 14:15:38)
    • 60 (2021-09-21 (火) 14:19:12)
    • 61 (2021-09-21 (火) 14:20:47)
    • 62 (2021-09-21 (火) 15:13:48)
    • 63 (2021-09-21 (火) 15:14:23)
    • 64 (2021-09-21 (火) 15:17:52)
    • 65 (2021-09-21 (火) 15:18:08)
    • 66 (2021-09-21 (火) 15:25:51)
    • 67 (2021-09-27 (月) 13:25:20)
    • 68 (2021-09-27 (月) 13:26:38)
    • 69 (2021-09-27 (月) 16:05:22)
    • 70 (2021-09-27 (月) 16:09:31)
    • 71 (2021-09-27 (月) 16:13:55)
    • 72 (2021-09-29 (水) 15:37:46)
    • 73 (2021-10-08 (金) 14:55:02)
    • 74 (2021-10-08 (金) 14:56:04)
    • 75 (2021-10-08 (金) 14:56:15)
    • 76 (2021-10-08 (金) 14:56:37)
    • 77 (2021-10-08 (金) 14:56:37)
    • 78 (2021-10-08 (金) 14:56:37)
    • 79 (2021-11-18 (木) 14:45:58)
    • 80 (2021-12-17 (金) 15:36:49)

全文検索システム『ひまわり』

 

本ページは,現在構築中です。

 
 
作成者:竹村明日香 (お茶の水女子大学)
作成協力:山口昌也 (国立国語研究所)
2021-09-xx 作成
 

1.パッケージの概要†

 本パッケージは、『上方はなしコーパス』を『ひまわり』用にインポートしたデータである。このデータには、本文とルビの他に、話者と地名の情報も取り込まれている。ただし形態論情報は含まれていないため、検索では文字列検索が基本となる。

↑

2.収録データの内容†

  • 原資料は、『上方はなしコーパス』(タグ付きテキストデータ)である。
  • 原資料について
    • 雑誌『上方はなし』全49集(1936-1940年発行)に掲載された五代目笑福亭松鶴口述の速記落語56作品(PDF)。具体的な作品名については、竹村明日香「『上方はなしコーパス』について――近代大阪方言の速記落語――」(田中牧郎・橋本行洋・小木曽智信編『コーパスによる日本語史研究――近代編――』ひつじ書房、2021年)を参照のこと。
    • 読みやすさを優先するため、原本の表記は現代仮名遣い・新漢字に改め、踊り字は開き、適宜改行を加えた。
  • 原資料からの変更点
    • 本文・ルビには基本的に変更を加えていない。ただし、検索の利便性を考慮して以下のような処理を行った。
      • カギ括弧・句読点・助詞の誤植と、原文通りの表記では検索が困難と思われるごく一部の漢字にのみ修正を加えた。それらには緑字の補注で修正の旨を記している。
      • 明らかな誤植の文字もそのまま本文に残し、緑字の補注で「ママ」と注記した。
    • 本文には「話者」と「地名」のタグ付けを行った。「話者」はその台詞の発話者を表す。「地名」はその作品の舞台となっている場所を表す。
      • 「話者」には、「話者1」「話者2」「話者3」まで分類がある。
        話者1:当該の台詞の発話者。
        話者2:「話者1」が自身の発話の中に引用した台詞の発話者。
        話者3:「話者1」が引用した「話者2」の発話の中に出てくる台詞の発話者。
      • 「地名」は、「大阪日本橋」「京都三条」のように「都道府県レベル 市町村レベル」の順に並べて記した。旅物などで地名がよくわからない場合は「不明」とした。
↑

3.パッケージのダウンロード†

  • 『上方はなしコーパス』パッケージ(2021-07-xx、約  )
  • 使用条件:
    • クリエイティブ・コモンズ 表示-非営利-改変禁止 4.0 国際 ライセンスで公開する。
      by-nc-nd.png
  • 本パッケージの複製・改変は,個人の利用の範囲内で行なうことが可能である。ただし,再配布は禁止する。本パッケージを利用したことにより直接的・間接的に生じるいかなる損害についても制作者は保証しない。
  • 本コーパスを用いた研究成果等を発表する場合には、以下の情報を明記してください。
    竹村明日香(2021)『上方はなしコーパス』ver.1、URL(20xx年xx月xx日確認)
↑

4.利用方法†

↑

4.1 インストール†

(『ひまわり』自体の使い方は,ビデオチュートリアル一覧をご参照ください)

  1. 『ひまわり』 (ver.1.6以上を推奨)をインストールする。
  2. 『上方はなしコーパス』のパッケージをダウンロードする。
  3. 『ひまわり』を起動し,ダウンロードした zip ファイルを『ひまわり』の検索画面上にドラッグ&ドロップする。
  4. 「インストールが終了しました」というメッセージが出れば,インストールは完了。すぐに検索できる状態になる。
  5. 次回以降は、『ひまわり』のツールバー[ファイル]⇒[コーパス選択]から『上方はなしコーパス』を選択して検索できる。
↑

4.2 検索対象の詳細†

(以下では、『上方はなしコーパス』のデータに固有の事柄について説明する。『ひまわり』自体の一般的な使い方については、利用者マニュアルを参照のこと)

本パッケージでは,次の項目を検索することができる。

検索対象
  • 本文(4.2.1)
  • 本文(正規表現)
  • ルビ(rt)完全一致
  • ルビ(rt)部分一致
  • 地名(部分一致)

注意:本コーパスでは、入力した文字列の通りにしか検索できない(例:「浪速」と入力すると「浪速」の例のみが現れ、「浪花」「難波」はヒットしない)。したがって検索の前には必ず『表記一覧』を確認して、自分の調べたい語がどのような表記になっているかを確認すること。表記が複数ある場合は正規表現(5.2.2)を用いて調べると良い。『表記一覧』には通常の漢字・仮名表記以外の形で記されているものを五十音順に列挙している。

↑

4.2.1 本文†

 速記落語の本文を検索する。形態論情報がついていないため、入力した通りの文字列が検索される。

  • 検索例1a:「今日」で全文検索をする。
  • 検索例1b:「今日」で全文検索し、その後文脈が「は」で始まる例がヒットする。
f2.1a.pngf2.1b.png
検索例1a検索例1b
↑

4.2.2 本文(正規表現)†

↑

4.2.3 ルビ(rt)完全一致†

↑

4.2.4 ルビ(rt)部分一致†

↑

4.2.5 地名(部分一致)†

↑

4.3検索結果†

 検索結果には次の情報が含まれる。

列名備考
前文脈キー(検索文字列)の直前にくる文脈
キー検索文字列
後文脈キー(検索文字列)の直後にくる文脈
Pathフォルダ名とファイル名
タイトル落語の作品名
集当該の例が現れる『上方はなし』の集数
発行年月当該の集が発行された年・月
舞台当該の作品で舞台となっている場所
話者1当該の台詞を話している人物
話者2話者1が引用している台詞を話している人物
話者3話者2が引用している台詞を話している人物
ページ雑誌初版(原本)でのページ数
原本画像雑誌初版(原本)のPDF画像へのリンク
備考当該箇所に関する備考
↑

4.4 本文データ全体の閲覧†

 検索結果の行をダブルクリックすると、当該のキーを含んだ本文全体を閲覧することができる。

  • 当該のキーは赤色で表示される。
  • 緑色の小文字は、制作者の補注である。
  • 補注にて「●」3などと記されているのは傍点である。
  • [[▲p.13]]などの青字は初版雑誌(原本)へのリンクである。「▲」は「当該の箇所より上」がこの原本に掲載されていることを表す。
  • 初版雑誌(原本)は、お茶の水女子大学教育・研究成果コレクションTeaPotに保存されている。原本コピーの一部には大阪府立中之島図書館の所蔵本が含まれている。原本の紙面のみを利用する場合には所蔵館への連絡が必要となる。

付記:『上方はなしコーパス』パッケージは、2016-2018年度科学研究費助成事業(若手研究)「上方落語を用いた近現代京阪方言の総合的研究」(16K16841、研究代表者・竹村明日香)の研究成果の一部である。


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS