#author("2021-07-08T09:07:38+00:00","default:rd","rd") #author("2021-07-08T09:07:54+00:00","default:rd","rd") [[全文検索システム『ひまわり』]] #br &color(red){&size(20){本ページは,現在構築中です。};}; #br #br //RIGHT:作成者:竹村明日香 (お茶の水女子大学) //RIGHT:作成協力:山口昌也 (国立国語研究所) RIGHT:2021-07-xx 作成 #br *1.パッケージの概要 [#t555f9b5] - 本パッケージは、[[『上方はなしコーパス』>https://teapot.lib.ocha.ac.jp/search?search_type=2&q=2217]]を『ひまわり』用にインポートしたデータである。このデータには、本文とルビの他に、話者と地名の情報も取り込まれている。ただし形態論情報は含まれていないため、検索では文字列検索が基本となる。 *2.収録データの内容 [#tbb7bad4] -原資料は、『上方はなしコーパス』のテキストデータである。 -原資料について --雑誌『上方はなし』全49集(1936-1940年発行)に掲載された五代目笑福亭松鶴口述の速記落語56作品。具体的な作品名については、竹村明日香「『上方はなしコーパス』について――近代大阪方言の速記落語――」(田中牧郎・橋本行洋・小木曽智信編『コーパスによる日本語史研究――近代編――』ひつじ書房、2021年)を参照のこと。 --読みやすさを優先するため、原本の表記は現代仮名遣い・新漢字に改め、踊り字は開き、適宜改行を加えた。 - 原資料からの変更点 --本文・ルビには基本的に変更を加えていない。ただし、検索の利便性を考慮して以下のような処理を行った。 --- カギ括弧・句読点・助詞の誤植と、原文通りの表記では検索が困難と思われるごく一部の漢字にのみ修正を加えた。それらには緑字の補注で修正の旨を記している。 --- 明らかな誤植の文字もそのまま本文に残し、緑字の補注で「ママ」と注記した。 -- 本文には「話者」と「地名」のタグ付けを行った。「話者」はその台詞の発話者を表す。「舞台」はその作品の舞台となっている場所を表す。 ---「話者」には、「話者1」「話者2」「話者3」まで分類がある。 話者1:当該の台詞の発話者。 話者2:「話者1」が自身の発話の中に引用した台詞の発話者。 話者3:「話者1」が引用した「話者2」の発話の中に出てくる台詞の発話者。 ---「地名」は、「大阪日本橋」「京都三条」のように「都道府県レベル 市町村レベル」の順に並べて記した。旅物などで地名がよくわからない場合は「不明」とした。 *3.パッケージのダウンロード [#m2221689] - 『上方はなしコーパス』パッケージ(2021-07-xx、約 ) //- 使用条件: //本パッケージの複製・改変は,個人の利用の範囲内で行なうことが可能である。ただし,再配布は禁止する。本パッケージを利用したことにより直接的・間接的に生じるいかなる損害についても制作者は保証しない。 クリエイティブ・コモン・ライセンス: //クリエイティブ・コモン・ライセンス: //作品のクレジットを表示すること・非営利目的であること・再配布禁止 //※本コーパスを用いた研究成果等を発表する場合には、以下の情報を明記してください。 // 竹村明日香(2021)『上方はなしコーパス』ver.1、URL(20xx年xx月xx日確認)