[[全文検索システム『ひまわり』]] //#contents //&size(18){&color(red){本ページは,まだ準備中です。};}; *1.はじめに [#z4bb5359] -『ひまわり』の応用例として,画像を含んだ『ひまわり』用 XML 文書の作成と検索の実例を示します。 -ここでは,4コママンガを『ひまわり』用のXML文書として記述します。 #ref(title.png,,20%) *2.準備 [#j24fe230] **2.1 サンプルデータのダウンロード [#u1bc0b70] 「マンガ」サンプルデータを次の場所からダウンロードしてください。本サンプルデータの著作権は,独立行政法人国立国語研究所が保持します。本サンプルデータは,[[GNU フリー文書利用許諾契約書:http://www.gnu.org/licenses/fdl.ja.html]] (ver.1.2) に定める条件の下で配布します。ダウンロードした時点で,この条件に御同意いただけたものとします。 -[[「マンガ」サンプルデータ>http://csd.ninjal.ac.jp/archives/Himawari/himawari_data_manga_sample_20160215.zip]] (約4MB,zip 形式,2016-02-15 公開) **2.2 インストール [#qc6cd003] +[[『ひまわり』>全文検索システム『ひまわり』]] をインストールしてください。 +パッケージをダウンロードし,次の手順でインストールして下さい。 --『ひまわり』ver.1.5.4以降では,ダウンロードしたファイルを『ひまわり』にドラッグ&ドロップするか,[ファイル]⇒[インストール]で指定して下さい。 --『ひまわり』ver.1.5.3までのバージョンでは,次の手順でインストールを行います。 --- ダウンロードしたファイルを解凍すると,Himawari_Manga フォルダが現れます。その中に次のファイルがあることを確認してください。 --- ダウンロードしたファイルを解凍すると,Himawari_manga_sample フォルダが現れます。その中に次のファイルがあることを確認してください。 Corpora フォルダ ... 「マンガ」サンプルデータを格納したフォルダ config_manga_sample.xml ... 設定ファイル --- Corpora フォルダ,config_manga_sample.xml を『ひまわり』がインストールされているフォルダの中に移動してください。 +以上で,インストールは終了です。 *3.使用方法 [#r7e067c2] **3.1 検索 [#s5ab4ae3] +『ひまわり』を起動し,[ファイル]→[新規]やドラッグ&ドロップで,『ひまわり』フォルダにある config_manga_sample.xml を読み込んでください。 +「検索文字列」欄に検索したい文字列を入力してください。ここでは,「きゃー」を指定します。「マンガ」サンプルは,データ量が少ないので,[[データの内容>#ca38536e]]に検索文字列があるかお確かめください。 +「検索」ボタンを押してください。 + 検索結果をダブルクリックすると、4コママンガ全体がブラウザに表示される。なお、当該の検索文字列は赤色で表示される。 **3.2 結果の見方 [#hd8970cb] -著者: 4コママンガの著者(4節の manga 要素の author 属性の値) -タイトル: 4コママンガのタイトル(4節の manga 要素の title 属性の値) -コマ番号: 4コママンガのコマ番号(4節の scene 要素の no 属性の値) -発話タイプ: 検索文字列の発話タイプ --speech、オノマトペ の別 --4節の sound 要素の type 属性の値 -発話源: 検索文字列の発話源(4節の sound 要素の source 属性の値) *4.データの内容 [#ca38536e] ページ末の4コママンガを『ひまわり』用 XML 文書で表現したのが、次のデータ である。この XML 文書は、配布パッケージ中の Corpus/Manga/corpus.xml に ある。また、画像データは、1コマ1画像ファイル(png 形式)として分割して ある。 <?xml version="1.0" encoding="UTF-16"?> <corpus name="漫画コーパス"> <manga title="ひまわりさんたち" author="画:桐生りか,原作:山口昌也" fig="title.png"> <scene fig="1.png" no="1"> <sound type="speech" source="陽くん">雨が降りそうだね</sound> <sound type="speech" source="葵ちゃん">降ってきた!</sound> <sound type="onomatopoeia" source="雨">ポツン</sound> </scene> <scene fig="2.png" no="2"> <sound type="speech" source="陽くん,葵ちゃん">きゃー急げ!!</sound> <sound type="speech" source="葵ちゃん">きゃー</sound> <sound type="speech" source="ひまわりお母さん">ぴーす</sound> </scene> <scene fig="3.png" no="3"> <sound type="speech" source="陽くん,葵ちゃん">あー助かった</sound> </scene> <scene fig="4.png" no="4"> <sound type="speech" source="陽くん,葵ちゃん">ありがとう〜</sound> <sound type="speech" source="ひまわりお母さん">ばいばい</sound> <sound type="onomatopoeia" source="おひさま">キラキラ</sound> </scene> </manga> </corpus> |1|2| |&ref(1.png,,30%);|&ref(2.png,,30%);| |&ref(3.png,,30%);|&ref(4.png,,30%);| |3|4|