全文検索システム『ひまわり』/ダウンロード/『上方はなしコーパス』パッケージ
をテンプレートにして作成
開始行:
[[全文検索システム『ひまわり』]]
#br
&color(red){&size(20){本ページは,現在構築中です。};};
#br
#br
RIGHT:作成者:竹村明日香 (お茶の水女子大学)
RIGHT:作成協力:山口昌也 (国立国語研究所)
RIGHT:2021-09-xx 作成
#br
*1.パッケージの概要 [#t555f9b5]
本パッケージは,[[『上方はなしコーパス』>]]を『ひまわり...
// 本パッケージは,[[『上方はなしコーパス』>https://www....
なお,本ページはパッケージの説明を行うものである。パッ...
*2.収録データの内容 [#tbb7bad4]
//-%%原資料は,[[『上方はなしコーパス』>https://www.dropb...
-原資料について
--雑誌『上方はなし』全49集(1936-1940年発行)に掲載された...
--読みやすさを優先するため,原本の表記は現代仮名遣い・新...
- 原資料からの変更点
--本文・ルビには基本的に変更を加えていない。ただし,検索...
--- カギ括弧・句読点・助詞の誤植と,原文通りの表記では検...
--- 明らかな誤植の文字もそのまま本文に残し,緑字の補注で...
-- 本文には「話者」と「地名」のタグ付けを行った。「話者」...
---「話者」には,「話者1」「話者2」「話者3」まで分類があ...
話者1:当該の台詞の発話者。
話者2:「話者1」が自身の発話の中に引用した台詞の発話者。
話者3:「話者1」が引用した「話者2」の発話の中に出てくる...
---「地名」は,「大阪日本橋」「京都三条」のように「都道府...
--本文には以下のような独自のタグ(『ひまわり』に同梱され...
--- t1:1つの作品全体をマークアップするタグ。属性として「...
--- t2:1つの発話をマークアップするタグ。属性として「話者...
--- u1:本文中の地名をマークアップするタグ。属性として「...
--- e1:空要素タグ。原本紙面へのリンク先を示す。
*3.パッケージのダウンロード [#m2221689]
- 『上方はなしコーパス』パッケージ(2021-09-xx,約 )
- 使用条件:
-- [[クリエイティブ・コモンズ 表示-非営利-改変禁止 4.0 国...
#ref(./by-nc-nd.png)
-- 本パッケージの複製・改変は,個人の利用の範囲内で行なう...
//--- 作品のクレジットを表示すること・非営利目的であるこ...
-- 本コーパスを用いた研究成果等を発表する場合には,以下の...
竹村明日香(2021)『上方はなしコーパス』ver.1,URL(20xx...
//-- クリエイティブ・コモン・ライセンス:
- 関連データ(ライセンスはパッケージと同一で,「クリエイ...
-- [[『上方はなしコーパス』(タグ付きテキスト)>]]
-- [[『表記一覧』>]]
*4.利用方法 [#za9319a3]
** 4.1 インストール [#p20e6d6b]
(『ひまわり』自体の使い方は,ビデオチュートリアル一覧を...
+『ひまわり』 (ver.1.6以上を推奨)をインストールする。
+『上方はなしコーパス』のパッケージをダウンロードする。
+『ひまわり』を起動し,ダウンロードした zip ファイルを『...
+「インストールが終了しました」というメッセージが出れば,...
+ 次回以降は,『ひまわり』のツールバー[ファイル]⇒[コーパ...
** 4.2 検索対象の詳細 [#t4850e3a]
(以下では,『上方はなしコーパス』のデータに固有の事柄に...
本パッケージでは,次の項目を検索することができる。
#ref(./f2.png,left,wrap,around,70%,検索対象)
- 本文(4.2.1)
- 本文(正規表現)
- ルビ(rt)完全一致
- ルビ(rt)部分一致
- 地名(部分一致)
#clear
注意:本コーパスでは,入力した文字列の通りにしか検索でき...
*** 4.2.1 本文 [#x968fef2]
速記落語の本文を検索する。形態論情報がついていないため...
- 検索例1a:「今日」で全文検索をする。
- 検索例1b:「今日」で全文検索し,その後文脈が「は」で始...
|&ref(./f2.1a.png,wrap,90%);||&ref(./f2.1b.png,wrap,90%);|
|検索例1a||検索例1b|h
*** 4.2.2 本文(正規表現) [#y2945660]
正規表現を用いて速記落語の本文を検索する。検索結果の「キ...
正規表現の一例
[ABC] A, B, Cのいずれかに一致する。
(A|B) AまたはBに一致する。
{n} 直前の文字列をn回繰り返す。
- 検索例2a:[叔小伯]父さん 「叔父さん」「小父さん」「...
- 検索例2b:走[らりるれろっ] 「走る」の活用形(五段活...
- 検索例2c:(縹緻|容色|容貌|器量) “きりょう”の複数あ...
- 検索例2d:(くる){2} 「くるくる」の例にマッチ...
|&ref(./f2.2a.png,wrap,90%);||&ref(./f2.2b.png,wrap,90%);|
|検索例2a||検索例2b|h
|&ref(./f2.2c.png,wrap,90%);||&ref(./f2.2d.png,wrap,90%);|
|検索例2c||検索例2d|h
*** 4.2.3 ルビ(rt)完全一致 [#o1f135e8]
速記落語の本文に振られたルビを検索する。検索文字列と完全...
- 検索例3:「ほんま」というルビの例にマッチする。
|&ref(./f2.3.png,wrap,100%);|
*** 4.2.4 ルビ(rt)部分一致 [#m67cfb94]
速記落語の本文に振られたルビを検索する。検索文字列と完全...
- 検索例4:「あ」のルビと,「あ」を含むルビ(あかん,つき...
|&ref(./f2.4.png,wrap,100%);|
*** 4.2.5 地名(部分一致) [#f19bdc8b]
速記落語の本文に出てくる地名を検索する(地名を含んだ河...
検索した文字列と部分的に一致する地名が表示されるため,例...
- 検索例5:「川」を含む固有名詞の地名の例にマッチする。
|&ref(./f2.5.png,wrap,100%);|
** 4.3検索結果 [#cab5506a]
検索結果には次の情報が含まれる。
|列名|備考|
|前文脈|キー(検索文字列)の直前にくる文脈|
|キー|検索文字列|
|後文脈|キー(検索文字列)の直後にくる文脈|
|Path|フォルダ名とファイル名|
|タイトル|落語の作品名|
|集|当該の例が現れる『上方はなし』の集数|
|発行年月|当該の集が発行された年・月|
|舞台|当該の作品で舞台となっている場所|
|話者1|当該の台詞を話している人物|
|話者2|話者1が引用している台詞を話している人物|
|話者3|話者2が引用している台詞を話している人物|
|ページ|雑誌初版(原本)でのページ数|
|原本画像|雑誌初版(原本)のPDF画像へのリンク|
|備考|当該箇所に関する備考|
** 4.4 『ひまわり』での検索結果の表示画面 [#db6a381f]
検索すると,結果が以下のように表示される。
検索例6:「今日」を検索した結果(一部)
|&ref(./f3.png,wrap,100%);|
** 4.5 本文データ全体の閲覧 [#v2fd7112]
『ひまわり』の検索結果画面で任意の行をダブルクリックす...
検索例7:「今日」(借家怪談)の検索結果のブラウザ表示例
|&ref(./f4.png,wrap,100%);|
-検索したキーは赤色で表示される。
-緑色の小文字は制作者の補注である。原文の表記に関する注が...
-補注にて「●」3,「、」3などと記されているのは,直前の語...
-[[▲p.13]]などの青字は初版雑誌(原本)へのリンクであ...
-初版雑誌(原本)の紙面は,[[お茶の水女子大学教育・研究成...
付記:『上方はなしコーパス』パッケージは,2016-2018年度科...
終了行:
[[全文検索システム『ひまわり』]]
#br
&color(red){&size(20){本ページは,現在構築中です。};};
#br
#br
RIGHT:作成者:竹村明日香 (お茶の水女子大学)
RIGHT:作成協力:山口昌也 (国立国語研究所)
RIGHT:2021-09-xx 作成
#br
*1.パッケージの概要 [#t555f9b5]
本パッケージは,[[『上方はなしコーパス』>]]を『ひまわり...
// 本パッケージは,[[『上方はなしコーパス』>https://www....
なお,本ページはパッケージの説明を行うものである。パッ...
*2.収録データの内容 [#tbb7bad4]
//-%%原資料は,[[『上方はなしコーパス』>https://www.dropb...
-原資料について
--雑誌『上方はなし』全49集(1936-1940年発行)に掲載された...
--読みやすさを優先するため,原本の表記は現代仮名遣い・新...
- 原資料からの変更点
--本文・ルビには基本的に変更を加えていない。ただし,検索...
--- カギ括弧・句読点・助詞の誤植と,原文通りの表記では検...
--- 明らかな誤植の文字もそのまま本文に残し,緑字の補注で...
-- 本文には「話者」と「地名」のタグ付けを行った。「話者」...
---「話者」には,「話者1」「話者2」「話者3」まで分類があ...
話者1:当該の台詞の発話者。
話者2:「話者1」が自身の発話の中に引用した台詞の発話者。
話者3:「話者1」が引用した「話者2」の発話の中に出てくる...
---「地名」は,「大阪日本橋」「京都三条」のように「都道府...
--本文には以下のような独自のタグ(『ひまわり』に同梱され...
--- t1:1つの作品全体をマークアップするタグ。属性として「...
--- t2:1つの発話をマークアップするタグ。属性として「話者...
--- u1:本文中の地名をマークアップするタグ。属性として「...
--- e1:空要素タグ。原本紙面へのリンク先を示す。
*3.パッケージのダウンロード [#m2221689]
- 『上方はなしコーパス』パッケージ(2021-09-xx,約 )
- 使用条件:
-- [[クリエイティブ・コモンズ 表示-非営利-改変禁止 4.0 国...
#ref(./by-nc-nd.png)
-- 本パッケージの複製・改変は,個人の利用の範囲内で行なう...
//--- 作品のクレジットを表示すること・非営利目的であるこ...
-- 本コーパスを用いた研究成果等を発表する場合には,以下の...
竹村明日香(2021)『上方はなしコーパス』ver.1,URL(20xx...
//-- クリエイティブ・コモン・ライセンス:
- 関連データ(ライセンスはパッケージと同一で,「クリエイ...
-- [[『上方はなしコーパス』(タグ付きテキスト)>]]
-- [[『表記一覧』>]]
*4.利用方法 [#za9319a3]
** 4.1 インストール [#p20e6d6b]
(『ひまわり』自体の使い方は,ビデオチュートリアル一覧を...
+『ひまわり』 (ver.1.6以上を推奨)をインストールする。
+『上方はなしコーパス』のパッケージをダウンロードする。
+『ひまわり』を起動し,ダウンロードした zip ファイルを『...
+「インストールが終了しました」というメッセージが出れば,...
+ 次回以降は,『ひまわり』のツールバー[ファイル]⇒[コーパ...
** 4.2 検索対象の詳細 [#t4850e3a]
(以下では,『上方はなしコーパス』のデータに固有の事柄に...
本パッケージでは,次の項目を検索することができる。
#ref(./f2.png,left,wrap,around,70%,検索対象)
- 本文(4.2.1)
- 本文(正規表現)
- ルビ(rt)完全一致
- ルビ(rt)部分一致
- 地名(部分一致)
#clear
注意:本コーパスでは,入力した文字列の通りにしか検索でき...
*** 4.2.1 本文 [#x968fef2]
速記落語の本文を検索する。形態論情報がついていないため...
- 検索例1a:「今日」で全文検索をする。
- 検索例1b:「今日」で全文検索し,その後文脈が「は」で始...
|&ref(./f2.1a.png,wrap,90%);||&ref(./f2.1b.png,wrap,90%);|
|検索例1a||検索例1b|h
*** 4.2.2 本文(正規表現) [#y2945660]
正規表現を用いて速記落語の本文を検索する。検索結果の「キ...
正規表現の一例
[ABC] A, B, Cのいずれかに一致する。
(A|B) AまたはBに一致する。
{n} 直前の文字列をn回繰り返す。
- 検索例2a:[叔小伯]父さん 「叔父さん」「小父さん」「...
- 検索例2b:走[らりるれろっ] 「走る」の活用形(五段活...
- 検索例2c:(縹緻|容色|容貌|器量) “きりょう”の複数あ...
- 検索例2d:(くる){2} 「くるくる」の例にマッチ...
|&ref(./f2.2a.png,wrap,90%);||&ref(./f2.2b.png,wrap,90%);|
|検索例2a||検索例2b|h
|&ref(./f2.2c.png,wrap,90%);||&ref(./f2.2d.png,wrap,90%);|
|検索例2c||検索例2d|h
*** 4.2.3 ルビ(rt)完全一致 [#o1f135e8]
速記落語の本文に振られたルビを検索する。検索文字列と完全...
- 検索例3:「ほんま」というルビの例にマッチする。
|&ref(./f2.3.png,wrap,100%);|
*** 4.2.4 ルビ(rt)部分一致 [#m67cfb94]
速記落語の本文に振られたルビを検索する。検索文字列と完全...
- 検索例4:「あ」のルビと,「あ」を含むルビ(あかん,つき...
|&ref(./f2.4.png,wrap,100%);|
*** 4.2.5 地名(部分一致) [#f19bdc8b]
速記落語の本文に出てくる地名を検索する(地名を含んだ河...
検索した文字列と部分的に一致する地名が表示されるため,例...
- 検索例5:「川」を含む固有名詞の地名の例にマッチする。
|&ref(./f2.5.png,wrap,100%);|
** 4.3検索結果 [#cab5506a]
検索結果には次の情報が含まれる。
|列名|備考|
|前文脈|キー(検索文字列)の直前にくる文脈|
|キー|検索文字列|
|後文脈|キー(検索文字列)の直後にくる文脈|
|Path|フォルダ名とファイル名|
|タイトル|落語の作品名|
|集|当該の例が現れる『上方はなし』の集数|
|発行年月|当該の集が発行された年・月|
|舞台|当該の作品で舞台となっている場所|
|話者1|当該の台詞を話している人物|
|話者2|話者1が引用している台詞を話している人物|
|話者3|話者2が引用している台詞を話している人物|
|ページ|雑誌初版(原本)でのページ数|
|原本画像|雑誌初版(原本)のPDF画像へのリンク|
|備考|当該箇所に関する備考|
** 4.4 『ひまわり』での検索結果の表示画面 [#db6a381f]
検索すると,結果が以下のように表示される。
検索例6:「今日」を検索した結果(一部)
|&ref(./f3.png,wrap,100%);|
** 4.5 本文データ全体の閲覧 [#v2fd7112]
『ひまわり』の検索結果画面で任意の行をダブルクリックす...
検索例7:「今日」(借家怪談)の検索結果のブラウザ表示例
|&ref(./f4.png,wrap,100%);|
-検索したキーは赤色で表示される。
-緑色の小文字は制作者の補注である。原文の表記に関する注が...
-補注にて「●」3,「、」3などと記されているのは,直前の語...
-[[▲p.13]]などの青字は初版雑誌(原本)へのリンクであ...
-初版雑誌(原本)の紙面は,[[お茶の水女子大学教育・研究成...
付記:『上方はなしコーパス』パッケージは,2016-2018年度科...
ページ名: