[PukiWiki]

全文検索システム『ひまわり』/画像を含んだ資料の作成方法(簡単な漫画を例に) の変更点

Top/全文検索システム『ひまわり』/画像を含んだ資料の作成方法(簡単な漫画を例に)

  • 追加された行はこの色です。
  • 削除された行はこの色です。
  • 全文検索システム『ひまわり』/画像を含んだ資料の作成方法(簡単な漫画を例に) へ行く。
  • 全文検索システム『ひまわり』/画像を含んだ資料の作成方法(簡単な漫画を例に) の差分を削除

[[全文検索システム『ひまわり』]]

//#contents

//&size(18){&color(red){本ページは,まだ準備中です。};};

*1.はじめに [#z4bb5359]
-『ひまわり』の応用例として,画像を含んだ『ひまわり』用 XML 文書の作成と検索の実例を示します。
-ここでは,4コママンガを『ひまわり』用のXML文書として記述します。

#ref(title.png,,20%)

*2.準備 [#j24fe230]
**2.1 サンプルデータのダウンロード [#u1bc0b70]
 「マンガ」サンプルデータを次の場所からダウンロードしてください。本サンプルデータの著作権は,独立行政法人国立国語研究所が保持します。本サンプルデータは,[[GNU フリー文書利用許諾契約書:http://www.gnu.org/licenses/fdl.ja.html]] (ver.1.2) に定める条件の下で配布します。ダウンロードした時点で,この条件に御同意いただけたものとします。

-[[「マンガ」サンプルデータ>http://csd.ninjal.ac.jp/archives/Himawari/himawari_data_manga_sample_20160215.zip]] (約4MB,zip 形式,2016-02-15 公開)


**2.2 インストール [#qc6cd003]
+[[『ひまわり』>全文検索システム『ひまわり』]] をインストールしてください。
+パッケージをダウンロードし,次の手順でインストールして下さい。 
--『ひまわり』ver.1.5.4以降では,ダウンロードしたファイルを『ひまわり』にドラッグ&ドロップするか,[ファイル]⇒[インストール]で指定して下さい。
--『ひまわり』ver.1.5.3までのバージョンでは,次の手順でインストールを行います。 
--- ダウンロードしたファイルを解凍すると,Himawari_Manga フォルダが現れます。その中に次のファイルがあることを確認してください。
--- ダウンロードしたファイルを解凍すると,Himawari_manga_sample フォルダが現れます。その中に次のファイルがあることを確認してください。
 Corpora フォルダ ... 「マンガ」サンプルデータを格納したフォルダ
 config_manga_sample.xml  ... 設定ファイル
--- Corpora フォルダ,config_manga_sample.xml を『ひまわり』がインストールされているフォルダの中に移動してください。
+以上で,インストールは終了です。


*3.使用方法 [#r7e067c2]
**3.1 検索 [#s5ab4ae3]
+『ひまわり』を起動し,[ファイル]→[新規]やドラッグ&ドロップで,『ひまわり』フォルダにある config_manga_sample.xml を読み込んでください。
+「検索文字列」欄に検索したい文字列を入力してください。ここでは,「きゃー」を指定します。「マンガ」サンプルは,データ量が少ないので,[[データの内容>#ca38536e]]に検索文字列があるかお確かめください。
+「検索」ボタンを押してください。
+ 検索結果をダブルクリックすると、4コママンガ全体がブラウザに表示される。なお、当該の検索文字列は赤色で表示される。

**3.2 結果の見方 [#hd8970cb]
-著者: 4コママンガの著者(4節の manga 要素の author 属性の値)
-タイトル: 4コママンガのタイトル(4節の manga 要素の title 属性の値)
-コマ番号: 4コママンガのコマ番号(4節の scene 要素の no 属性の値)
-発話タイプ: 検索文字列の発話タイプ
--speech、オノマトペ の別
--4節の sound 要素の type 属性の値
-発話源: 検索文字列の発話源(4節の sound 要素の source 属性の値)


*4.データの内容 [#ca38536e]

 ページ末の4コママンガを『ひまわり』用 XML 文書で表現したのが、次のデータ
である。この XML 文書は、配布パッケージ中の Corpus/Manga/corpus.xml に
ある。また、画像データは、1コマ1画像ファイル(png 形式)として分割して
ある。

 <?xml version="1.0" encoding="UTF-16"?>
 <corpus name="漫画コーパス">
 <manga title="ひまわりさんたち" author="画:桐生りか,原作:山口昌也" fig="title.png">
     <scene fig="1.png" no="1">
         <sound type="speech" source="陽くん">雨が降りそうだね</sound>
	 <sound type="speech" source="葵ちゃん">降ってきた!</sound>
	 <sound type="onomatopoeia" source="雨">ポツン</sound>
     </scene>
     <scene fig="2.png" no="2">
	 <sound type="speech" source="陽くん,葵ちゃん">きゃー急げ!!</sound>
	 <sound type="speech" source="葵ちゃん">きゃー</sound>
	 <sound type="speech" source="ひまわりお母さん">ぴーす</sound>
     </scene>
     <scene fig="3.png" no="3">
	 <sound type="speech" source="陽くん,葵ちゃん">あー助かった</sound>
     </scene>
     <scene fig="4.png" no="4">
	 <sound type="speech" source="陽くん,葵ちゃん">ありがとう〜</sound>
	 <sound type="speech" source="ひまわりお母さん">ばいばい</sound>
	 <sound type="onomatopoeia" source="おひさま">キラキラ</sound>
     </scene>
 </manga>
 </corpus>


|1|2|
|&ref(1.png,,30%);|&ref(2.png,,30%);|
|&ref(3.png,,30%);|&ref(4.png,,30%);|
|3|4|

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS