#author("2023-01-21T14:04:35+09:00","default:rd","rd") #author("2023-01-21T14:06:36+09:00","default:rd","rd") [[全文検索システム『ひまわり』]] *はじめに [#w140b63c] この文書は,「ひまわり」の設定ファイルのリファレンスである。 #contents *設定一覧 [#hfee5fa7] **コーパス,索引ファイル関連 [#v20eef03] ***&aname(corpora){corpora 要素}; [#k3a0184b] コーパス集合を定義する要素 -属性 --name: コーパス集合名 --dbpath: データベースへのパス(存在しない場合は,一つ目のli/@pathのディレクトリを使用) &color(red){(since ver.1.5β)}; -li (空要素) --@name: コーパス名 --@path: コーパスファイル名へのパス+コーパスファイル名の本体(body) --@isSelected &color(red){(since ver.1.3)};: 検索対象とするか否か ---false: しない ---true: する(default) -例 <corpora name="「太陽」コーパス"> <li name="「太陽」" path="Corpora/Zassi/Taiyo/corpus" /> <li name="女性雑誌" path="Corpora/Zassi/Josei/corpus" /> </corpora> ***index_cix 要素 [#gd128a20] 要素内容への索引 -li (空要素) --@name: 索引対象の要素名 --@label: 検索対象選択メニューに表示される文字列 --@middle_name: 索引ファイルの第2拡張子(ファイル名の末尾から2番目の拡張子) --@field_name: 結果レコードに照合した文字列を格納するフィールド名 --@type: 索引タイプ ---normal (default) ... 指定された要素の索引を作成する(検索文字列の先頭文字列が指定した要素内にあれば,マッチングする) ---record_based ... 指定された要素の索引を作成する(検索文字列がすべて指定した要素内になければマッチングしない) ---null ... 検索時に索引を使用しない(正規表現が利用可能)&color(red){(since ver.1.3)}; ---restricted &color(red){(obsoleted since ver.1.3)}; --@stop_element: ストップ要素名 --@isEditable: 編集の可否 &color(red){(since ver.1.3)}; ---true ---false (default) -例 <index_cix> <li label="本文" name="雑誌" middle_name="magazine" type="normal" field_name="キー" /> <li label="本文(s 要素考慮)" name="雑誌" middle_name="magazine" type="normal" stop_element="s" field_name="キー" /> </index_cix> ***index_eix 要素 [#nbdfec70] 要素への索引 -li (空要素) --@name: 索引対象の要素名 --@middle_name: 索引ファイルの第2拡張子(ファイル名の末尾から2番目の拡張子) --@is_empty: 空要素か否か ---true (= empty_forward) ---false (default) ---empty_forward(後方検索) ... マッチした文字列の後方に存在する指定要素に対する索引 &color(red){(since ver.1.3)}; ---empty_backward(前方検索)... マッチした文字列の前方に存在する指定要素に対する索引 &color(red){(since ver.1.3)}; --@top: 資料の最大要素 --@isBrowsed: 閲覧対象の要素か否か -例 <index_eix> <li name="雑誌" middle_name="magazine" is_empty="false" top="true" /> <li name="記事" middle_name="article" is_empty="false" isBrowsed="true" /> <li name="引用" middle_name="quote" is_empty="false" /> <li name="l" middle_name="ref" is_empty="true" /> </index_eix> ***index_aix 要素 [#w1c92f72] 要素属性への索引 -li (空要素) --@name: 索引対象の要素名 --@argument: 索引対象の属性名 --@label: 検索対象選択メニューに表示される文字列 --@middle_name: 索引ファイルの第2拡張子(ファイル名の末尾から2番目の拡張子) --@field_name: 結果レコードに照合した文字列を格納するフィールド名 --@type: 索引タイプ ---normal (default) ... 指定したキーで属性を検索 ---record_based ... 指定したキーで属性を検索(前後文脈を検索条件で指定する代わりに,キー前後の文字列(つまり属性)を正規表現で指定。例えば,「あ」で始まる属性を検索すると行ったことが可能) ---db ... データベースに格納されたアノテーション情報に基づき検索する ---six ... --@isCompleteMatch: 完全一致検索をするか否か(このオプションを変更した場合は、再度索引づけする必要あり) ---true ---false (default) -例 <index_aix> <li label="ルビ(rt)完全一致" name="r" middle_name="r" argument="rt" isCompleteMatch="true" field_name="キー" /> <li label="ルビ(rt)部分一致" name="r" middle_name="r2" argument="rt" type="record_based" isCompleteMatch="false" field_name="キー" /> <li label="外字(name)" name="外字" middle_name="gaiji" argument="name" isCompleteMatch="true" field_name="キー" /> </index_aix> **検索設定関連 [#m8e2079b] ***field_setting 要素 [#xb8cadd1] 結果レコードのフィールド定義 -li (空要素) --@name: フィールド名 --@type: フィールドタイプ ---argument: 属性検索 ---sibling: 兄弟要素検索 ---relative: 隣接要素検索 ---index: レコード索引(行番号) ---db: データベース検索 &color(red){(since ver.1.5)}; --@width: フィールド幅 (default: 40) --@align: 文字揃え ---LEFT (default) ---CENTER ---RIGHT --@edit_type: 編集タイプ &color(red){(since ver.1.5)}; ---TEXT ... 自由記述(default) ---SELECT ... 選択記述 --@edit_option: 編集オプション &color(red){(since ver.1.5)}; --@element: 表示対象の要素 --- 特殊要素 _EDIT ... 編集 --@attribute: 表示対象の要素属性 --@isEditable: 編集の可否 &color(red){(since ver.1.5)}; --- true ... 編集可能 --- false ... 編集不可(default) --@sort_direction: ソート方向 ---L ... 左から右(default) ---R ... 右から左 --@sort_order: ソート順位 (1〜) --@sort_type: ソートの種類 ---string (default) ... 文字列としてソート ---numeric ... 数字としてソート -例 <field_setting> <li name="no" type="index" width="30" align="RIGHT" sort_direction ="L" /> <li name="類似する語(前)" type="preceding_context" element="_sys" attribute="_preceding_context" width="180" align="RIGHT" sort_direction="R" /> <li name="表記" type="key" element="_sys" attribute="_key" width="80" align="LEFT" sort_direction="L" /> <li name="類似する語(後)" type="following_context" element="_sys" attribute="_following_context" width="160" align="LEFT" sort_direction="L" /> <li name="見出し" type="argument" element="e" attribute="見出し" width="80" align="LEFT" sort_direction="L" sort_order="1" /> <li name="概念パス" type="argument" element="c" attribute="概念パス" width="80" align="LEFT" sort_direction="L" sort_order="2"/> <li name="分類番号" type="argument" element="c" attribute="分類番号" width="80" align="LEFT" sort_direction="L" /> <li name="行番号" type="argument" element="s" attribute="行番号" width="80" align="LEFT" sort_direction="L" /> <li name="行内番号" type="argument" element="l" attribute="行内番号" width="80" align="LEFT" sort_direction="L" /> </field_setting> ***length_context_kwic 要素 [#v72242d7] KWIC の文脈長を定義 -@value: 文脈長(文字) -例 <length_context_kwic value="10" /> ***length_context_search 要素 [#ma8cc1da] 正規表現検索時の照合文字列長の定義 -@value: 文脈長(文字) -例 <length_context_search value="10" /> *** preceding_context_constraint 要素 [#c3ed247d] 前文脈の制約値を定義。この値は,前文脈欄の history 機能の履歴として登録される。 -@value: 制約値 -例 <preceding_context_constraint value="[^0-9ァ-ヴーa-zA-Z./・:][^0-9ァ-ヴーa-zA-Z\s]?$" /> *** following_context_constraint 要素 [#e5e96051] 後文脈の制約値を定義。この値は,後文脈欄の history 機能の履歴として登録される。 -@value: 制約値 -例 <following_context_constraint value="^[^0-9ァ-ヴーa-zA-Z\s]?[^0-9ァ-ヴーa-zA-Z./・:]" /> **GUI 関連 [#h02e1e44] ***fontsize 要素 [#nf0aeb7c] GUI のフォントサイズの定義 -@value: 7 〜 18 (pt) -例 <fontsize value="14" /> *** isIndexingEnable 要素 [#pbc9cf50] メニュー項目 ''[ツール]→[インデックス生成]'' を表示するか否か -@value --true --false (default) -例 <isIndexingEnable value="true" /> *** isGenerateCorpusFileEnable 要素(&color(red){ver.1.5で廃止};) [#j03c71bc] メニュー項目 ''[ツール]→[コーパスファイル生成]'' を表示するか否か -@value --true --false (default) -例 <isGenerateCorpusFileEnable value="false" /> **閲覧関連 [#w453b036] ***browsers 要素 [#i45d9c2f] 閲覧用の WWW ブラウザの定義(1.7から .himawari_sys_config.xmlへ移動) -@temp_file: ブラウズ時のテンポラリファイル --@label: [ツール]→[閲覧]中の項目文字列 -li (空要素) --@name: ブラウザ名 --@path: ブラウザの実行プログラムへのパス --- パスに "Program Files" を含み,起動に失敗した場合,"Program Files (x86)"に置換した上で再実行 --- [[default_browser]]の場合は,OSのデフォルトブラウザを使用(&color(red){since 1.6};) --@option: ブラウザ実行時のオプション --@os: 対応するOS名 --- Windows --- Mac --- Linux --%%@omit_scheme%% ... &color(red){廃止}; ---true ... isBrowsed が true の要素閲覧時の URL に対して,スキーム(file://)を付けない。 ---true 以外 ... スキームを付ける。 -例 <browsers temp_file="__searched_tmp.xml" label="記事"> <li name="Microsoft Internet Explorer" path="c://progra~1/intern~1/iexplore" /> <li name="Mozilla" path="mozilla" /> </browsers> ***xsl_files 要素 [#pe6d89a2] 閲覧用の XSL ファイルに関する定義 -@root_path: XSL ファイルを格納しているディレクトリのルートパス(「ひまわり」を格納しているディレクトリからの相対パスで定義) -@temp_dir: XSL ファイルを格納しているディレクトリのルートパス(「ひまわり」を格納しているディレクトリからの相対パスで定義) -li (空要素) --@name: XSL ファイル名 --@label: -例 <xsl_files root_path="xslt"> <li label="横書き・段落表示" name="zassiHP.xsl" /> <li label="横書き・行番号表示" name="zassiHL.xsl" /> <li label="縦書き・段落表示" name="zassiVP.xsl" /> <li label="縦書き・行番号表示" name="zassiVL.xsl" /> </file_xsl> **外部データベース関連 [#o81ee2f0] ***external_tools 要素 (&color(red){since ver.1.6};)[#l9989fb8] 外部ツールへのアクセス方法の定義。後述の[[access_command1, 2要素>#ha1ed5ba]]では,2個までしか定義できなかったが,3個以上定義できるようにした。また,OS別の記述も可能 - li (空要素) -- @field: 実行プログラムの起動用フィールド。検索結果ウィンドウの指定されたフィールドをダブルクリックすると当該コマンドが実行される。正規表現も可。 -- @path: 実行プログラム。[[]]で囲う。セキュリティ上,次のコマンドに限定して使用 --- VLC --- FishWatchr --- Firefox --- Chrome --- Safari (macOSのみ) --- Edge (Windowsのみ) --- soundplayer ... 第1引数: サウンドファイル,第2引数:再生開始時間,第3引数: 再生終了時間 --- xdb1, xdb2 ... 第1引数: DB検索キー,第2引数: 結果表示ウィンドウの幅 --- browser ... 第一引数: URL -- @argument: 実行プログラムの引数 ---(())で囲われている場合は,検索結果中の当該フィールド値で置き換えられる。 --- @field が指定されておらず,@argument の値がフィールド指定になっていれば,それが起動用フィールドとしても利用されるになる(ただし,「((雑誌名)) 400px」のように,フィールド指定の文字列以外の文字列を含んではならない)。 --- 内部コマンドでない場合,@argument中の引数が複数ある場合,"_/_"で区切る。空白は引数の区切りには使用できない(ファイル名中の空白と区別するため) --- {{PWD}}は『ひまわり』実行ファイルのパスに置き換えられる。 --- {{PWD}}は『ひまわり』実行ファイルのパスに置き換えられる(macOSの場合は.app)。 -- @name: 設定名(重複しないように設定すること)。メニューには@labelの値が用いられる。 -- @os: 対応するOS名 --- Windows --- Mac --- Linux ***access_command1, access_command2 要素 (deprecated)[#ha1ed5ba] 外部ツールへのアクセス方法の定義(2通り定義できる)。ver.1.6からexternal_tools 要素を推奨。 -@label: メニュー用のラベル -@path: 実行プログラムへのパス。ただし,[[]] で囲われている場合は,次の内部コマンドを実行する。 --soundplayer ... 音声再生用プログラム --xdb1, xdb2 ... 簡易データベース検索プログラム。それぞれ,ext_db1, ext_db2 要素で設定を行う。 --browser ... ブラウザ。browser 要素で指定されたプログラムを利用する。 (&color(red){since 1.5};) -@argument: 実行プログラムの引数 --(())で囲われている場合は,検索結果中の当該フィールド値で置き換えられる。 --@field が指定されておらず,@argument の値がフィールド指定になっていれば,それが起動用フィールドとしても利用されるになる(ただし,「((雑誌名)) 400px」のように,フィールド指定の文字列以外の文字列を含んではならない)。 -- 内部コマンドでない場合,@argument中の引数が複数ある場合,"_/_"で区切る。空白は引数の区切りには使用できない(ファイル名中の空白と区別するため) --内部コマンドの引数 ---soundplayer ... 第1引数: サウンドファイル,第2引数:再生開始時間,第3引数: 再生終了時間 ---xdb1, xdb2 ... 第1引数: DB検索キー,第2引数: 結果表示ウィンドウの幅 ---browser ... 第一引数: URL -@field: 実行プログラムの起動用フィールド。検索結果ウィンドウの指定されたフィールドをダブルクリックすると当該コマンドが実行される。(&color(red){since 1.3};) -例 <access_command1 label="著者情報" path="[[xdb1]]" argument="((著者))" /> <access_command1 label="著者DB" path="[[xdb1]]" argument="((著者)) 400px" field="著者ID"/> ***ext_db1, ext_db2 要素 [#ic1c64ac] [ツール]→[一覧]から参照される外部データベースの参照形態を定義する。また,ext_db1, ext_db2 は,それぞれ xdb1, xdb2 用の設定である。 -@name: データベース名。この名前は,[ツール]→[一覧]で表示される文字列としても使われる。 -@url: データベースファイルへの URL -@record_name: 検索対象のレコード名 -@key: 検索対象のフィールド名 -li (空要素) --@name: フィールド名 --@width: フィールド幅 (default: 40) --@align: 文字揃え --@sort_order: ソート順位 (1〜) --@sort_type: ソートの種類 ---string (default) ... 文字列としてソート ---numeric ... 数字としてソート -例 <ext_db name="著者DB" url="authors.xml" record_name="著者" key="氏名"> <li name="氏名" width="100" sort_order="1" /> <li name="氏名よみ" width="100" /> <li name="所属" width="80" /> <li name="分野" width="80" /> <li name="生年" width="50" align="RIGHT" /> <li name="没年" width="50" align="RIGHT" /> </ext_db> ***jitaidic 要素 [#affaa2dd] 字体辞書の定義 -@url: 字体辞書ファイルのURL -例 <jitaidic url="jitaidic.xml" /> **一覧表示機能関連 [#ob3bf0f2] ***corpus_fields [#we9d8381] 収録しているコーパスの一覧を表示する ***unit_fields [#he1015c2] 閲覧対象要素の一覧を表示する。閲覧対象要素は,index_eix/@isBrowsed で定義する。 ***user_defined_lists (&color(red){since ver.1.6, 未確定};) [#h0dee5e2] 指定した要素の一覧を表示する。なお,element 要素は複数記述することができる。 - @label: (廃止予定) - element 要素 -- @name: 一覧対象の要素名 -- @label: メニュー表示用のラベル -- li 要素 --- @name: 表示用のフィールド名 --- @element: 表示する属性の要素名(ただし,一覧する要素か,それを包含する要素) --- @attribute: 表示する属性名 &br;なお,特殊な属性値として,_contents (要素内容を表示),_length (要素内容の文字数を表示)が定義されている。 --- @width: フィールド幅 --- @align: 文字揃え --- @sort_order: ソート順位 (1〜) --- @sort_type: ソートの種類 ***stat_fields_1, stat_fields_2, stat_fields_3 [#ncda1b19] 頻度計算するのに利用するフィールドの定義 -@label: [ツール]→[統計]メニュー用のラベル -li (空要素) --@name: フィールド名 --@width: フィールド幅 (default: 40) --@align: 文字揃え --@sort_order: ソート順位 (1〜) --@sort_type: ソートの種類 ---string (default) ... 文字列としてソート ---numeric ... 数字としてソート -例 <li name="キー" width="40" /> <li name="年" width="50" align="RIGHT" /> <li name="号" width="50" align="RIGHT" /> <li name="頻度" width="60" align="RIGHT" sort_type="numeric" /> ** インポート関連 (&color(red){since 1.5β};) [#maa47222] *** import / target_file_type 要素 [#ta759847] インポート時のデフォルトのインポート対象ファイルを設定 - @names: 対象ファイルの種類 -- txt: テキストファイル -- xhtml: HTML,および,XHTML ファイル -- xml: XML ファイル -例 <target_file_type names="txt,xhtml" /> *** import / char_normalization 要素 [#t9f65b3f] インポート時のデフォルトの文字正規化方法を設定 - @name: 正規化方法 -- none: なし -- user_defined: ユーザ定義 -- nfkc: NFKC (Unicode) -例 <char_normalization name="none" /> *** import / char_convertion_table 要素 [#bcbacdb8] インポート時のテキスト変換用テーブルの設定。import/char_normalization[@name="user_defined"]の時に使用される。文字の対応は @from と @to で,先頭から1文字ずつが対応するように定義する。 - @from: 変換前 - @to: 変換後 -例(数字の半角⇒全角変換) <char_convertion_table from="0123456789" to="0123456789" /> *** import / text_transformation_definition 要素 [#kd375fdc] インポート時のテキスト置換用定義ファイルを指定 - @dir: 定義ファイルが存在するフォルダ - @default: デフォルトの定義ファイル名 - 例 <text_transformation_definition dir="resources/htd" default="aozora.htd" /> - 定義ファイルの仕様 -- 例 # 改行位置に,<br />を挿入 \n <br />\n # ルビ(範囲指定あり) [|](.+?)《(.+?)》 <r rt="$2">$1</r> -- 置換規則は,先頭から順番に適用される。 -- 定義ファイルの文字コードは,UTF-8 で記述する。 -- 置換対象の文字列は正規表現で指定する。正規表現は Java の [[java.util.regrex.Pattern クラス>http://docs.oracle.com/javase/jp/7/api/java/util/regex/Pattern.html]]に準じる。 -- 置換対象,置換文字列はタブで区切る。置換文字列には,$1, $2 などの前方参照値を使うことができる。詳細は, [[java.util.regrex.Matcher クラス>http://docs.oracle.com/javase/jp/7/api/java/util/regex/Matcher.html#replaceAll%28java.lang.String%29]]の解説を参照のこと。 -- 先頭が # で,タブの数が一つでない行は,コメントとみなされる。 *** import / xhtml_style_sheet 要素 [#b01441ae] インポート時の XHTML ファイル用のスタイルシートを指定 - @dir: スタイルシートファイルが存在するフォルダ - @default: デフォルトのスタイルシートファイル - @isTidied: HTML⇒XHTML変換の可否のデフォルト値 -- true: 変換する -- false: 変換しない - 例 <xhtml_style_sheet dir="resources/xsl/xhtml" default="xhtml2xml_aozora.xsl" isTidied="true" /> *** import / xml_style_sheet 要素 [#g64531d8] インポート時の XML ファイル用のスタイルシートを指定 - @dir: スタイルシートファイルが存在するフォルダ - @default: デフォルトのスタイルシートファイル - 例 <xml_style_sheet dir="resources/xsl/xml" default="xml.xsl" /> *** import / as_subcorpora 要素 (&color(red){since 1.5β04};) [#t8890e6b] インポート対象フォルダの直下のフォルダをサブコーパスとしてインポートする。 - @value: -- false: サブコーパスとしない(default) -- true: サブコーパスとする - 例 <include_subcorpora value="true" /> *** import / not_now_indexing 要素 (&color(red){since 1.5β04};) [#dd548ed6] インポート時にすぐ索引づけしないように設定する。 - @value: -- true: すぐ索引づけしない -- false: すぐ索引づけする(default) - 例 <not_now_indexing value="true" /> *** import / source_files 要素 (&color(red){since 1.5β04};) [#x2f95c9c] インポート時にコピーするファイルを指定する。なお,ファイルのパスの起点は,ユーザが指定したインポート対象のフォルダである。 - @corpus_dir: コーパスのソースファイルを格納したフォルダ - @corpus_name: コーパス名 - @config_file1: 設定ファイル1(必須) - @config_file2: 設定ファイル2(任意) - @xslt_dir: xslt のフォルダ - @aux_dir: 補助フォルダ - 例 <source_files corpus_dir="test_src" corpus_name="test" config1="config.test.xml" config2="config.test.db.xml" xslt_dir="xslt" aux_dir="aux" /> ** アノテーション関連 [#jd2d1ef5] *** annotator 要素 (&color(red){since 1.5β};) [#d830111c] アノテーションをするための外部プログラムの定義 -li 要素 ... 一つの外部プログラム --@name: 外部プログラム名 --@os: 対象のOS --@annotation: アノテーション名 (field_setting/li/@type="db" のとき,field_setting/li/@element で指定する名前となる) --@command: 外部プログラムへのパス (パス中に「Program Files」を含み,当該のコマンドが存在しない場合は,「Program Files (x86)」のパスでも実行を試みます) --@option: 外部プログラム実行時のオプション --@encoding: 外部プログラムが入力として想定する文字コード (&color(red){since 1.6};) -li/extract ... コーパス中でアノテーションの対象となる要素 --@name ... 要素名 --@attribute ... 要素の属性名 --@value ... 属性値 --例 <extract element="" attribute="" value="" /> ... 全要素を対象とする <extract element="s" attribute="" value="" /> ... s 要素を対象とする <extract element="引用" attribute="種別" value="会話" /> ... 「引用」要素のうち,「種別」属性が「会話」のものを対象とする --注意 --- @attribute を指定しない場合,@name で指定した任意の要素が処理対象になる --- 指定する要素は,連続しているか,改行で区切られていなければならない。この条件が満たされない場合,アノテーションに失敗する可能性がある。 -li/chunk ... extract 要素で指定されたコーパス中の要素を外部プログラムが処理する単位を決定する。 --@delimitor ... 単位分割するための正規表現 --@maxlength ... 1処理単位に含まれる最大文字数(これを超えた場合,強制的に分割される) --例(最大200文字で,「。」または「?」で区切られる単位を1処理単位とする場合) <chunk delimitor="[。?]+" maxlength="200" /> -li/result_fields ... 外部プログラムの出力の形式を定義する。 --@delimitor ... 外部プログラムの出力結果のフィールド区切り文字 --li/@name ... フィールド名 --- li 要素の順序は,外部プログラムの出力結果のフィールド順と対応する --- field_setting/li/@type="db" のとき,field_setting/li/@attribute で指定する名前となる --- "_TEXT"は,解析対象の文字列(形態素解析の場合は,出現形に相当)を表す。&color(red){出力結果にはこのフィールドを必ず含まなければならない。}; --- "_unused"で始まる場合,辞書のフィールドとして追加しない。(&color(red){since 1.6};) --li/@isIndexed ... field_setting/li/@type="db" 用の索引の有無 --- true: 索引あり --- false: 索引なし(default) --li/@contextLength ... 前後要素長 (&color(red){since 1.6};) --- 当該要素の前後n個分のフィールドを検索結果に追加する --- @name="基本形",@contextLength=2のとき,四つのフィールド「基本形-2」「基本形-1」「基本形1」「基本形2」を検索結果に追加する --例 <li name="_TEXT" isIndexed="true" /> <li name="読み" /> <li name="基本形" /> <li name="品詞" /> <li name="細品詞" /> <li name="活用型" /> <li name="活用形" /> **「ひまわり」資料参照関連 [#lee5061d] ***manual 要素 [#w4d7ae3a] 「ひまわり」マニュアルの URL の定義 (ver.1.7から .himawari_sys_config.xmlへ移動) -@url: 「ひまわり」マニュアルの URL (なお,URL にプロトコルが指定されていない場合は,ファイルとみなし,file:// とパスを付加する) -例 <manual url="manual/index.html" /> ***hp 要素 [#v2cafd89] 「ひまわり」ホームページの URL の定義 (ver.1.7から .himawari_sys_config.xmlへ移動) -@url: 「ひまわり」ホームページの URL -例 <hp url="http://mimir.corpus.rd1.local/resource/index.php" /> ***package_manual 要素 [#n8256b2c] パッケージ用のマニュアルの URL の定義 (since ver.1.7) -@url: パッケージ用のマニュアルの URL -例 <package_manual url="https://csd.ninjal.ac.jp/lrc/index.php?%C1%B4%CA%B8%B8%A1%BA%F7%A5%B7%A5%B9%A5%C6%A5%E0%A1%D8%A4%D2%A4%DE%A4%EF%A4%EA%A1%D9/%A1%D8%C6%FC%CB%DC%B8%EC%C6%FC%BE%EF%B2%F1%CF%C3%A5%B3%A1%BC%A5%D1%A5%B9%A1%D9%A5%E2%A5%CB%A5%BF%A1%BC%B8%F8%B3%AB%C8%C7" /> ***package_hp 要素 [#v57d8186] パッケージ用のホームページの URL の定義 (since ver.1.7) -@url: パッケージ用のホームページの URL -例 <package_hp url="https://www2.ninjal.ac.jp/conversation/corpus.html" /> **全体設定 [#y86b7faf] *** setting要素 [#w87b76db] 設定ファイル全体のルート要素 -@allowOverRide: 設定ファイル間で重複する要素の扱い (since ver.1.7) -- true: 後から読み込まれた設定を優先する(デフォルト)。なお,パッケージ設定ファイル,.himawari_sys_config.xmlの順で読み込まれる。 -- false: 後から読み込まれた設定は無視する * 『ひまわり』の設定ファイル [#h3fd2c2b] - config.xml -- 『ひまわり』に付属している『青空文庫サンプル』パッケージ用の設定ファイル。『ひまわり』のデフォルトパッケージ - config_xxx.xml (xxxはワイルドカード) -- configで始まる設定ファイルは,各パッケージ用の設定ファイル - .himawari_import_config.xml -- インポート設定用のファイル -- インポート用のパッケージに同梱することにより,個別設定が可能 -- ver.1.7からは,『ひまわり』フォルダ直下の .himawari_import_config.xmlは,.himawari_sys_config.xmlに統合される。 - .himawari_annotator_config.xml -- 外部アノテータ用の設定ファイル -- ver.1.7からは .himawari_sys_config.xmlに統合される。 - .himawari_sys_config.xml (since ver.1.7) -- パッケージとは独立した設定で,『ひまわり』自体を設定するファイル -- インポート,外部アノテータ,ブラウザの設定を含む。 --- なお,ver.1.6まで,インポート,外部アノテータの設定はそれぞれ.himawari_import_config.xml と .himawari_annotator_config.xml,ブラウザの設定は各パッケージ用の設定ファイルで記述していた。 * パッケージインストール設定ファイル [#aff0b1a0] パッケージインストール設定ファイル(.himawari_package_info)は,インストール機能([ファイル]⇒[インストール],ver.1.5 以降)に対応したパッケージに同梱されるもので,インストールするファイルのリストが記述される。 ** パッケージインストール設定ファイルの仕様 [#v1e77d3a] - パッケージインストール設定ファイルの名前は,.himawari_package_info とし,パッケージを含むディレクトリのルートに設置するものとする。 - パッケージ設定ファイルの文字コードは,UTF-8 とする。ただし,文字コードに起因するコピー時の問題を避けるため,ISO/IEC 646 の範囲で記述することを推奨する。 - パッケージ設定ファイルには,『ひまわり』フォルダにコピーするファイル,及び,フォルダを列挙する。 -- コピーするファイル,および,フォルダの指定は,『ひまわり』フォルダを起点とする相対パスで指定する(下記の例を参照のこと)。 -- コピー先は,次の場所に限定する。 --- Corpora フォルダ内 --- resources フォルダ内 --- 『ひまわり』フォルダ直下(この場合は,『ひまわり』設定ファイルのみ) -- フォルダを指定した場合,フォルダに含まれるすべてのファイルがコピーされる。 - 『ひまわり』設定ファイルがパッケージに同梱されていれば,インストール成功時に自動的に読み込まれる。なお,『ひまわり』設定ファイルが複数ある場合は,最初に指定されたものが読み込まれる。 ** パッケージインストール設定ファイルの例 [#w29cc28b] *** 『分類語彙表』パッケージ [#r6cd10e5] Corpora/Bunrui config_bunrui.xml - パッケージの Corpora/Bunrui と config_bunrui.xml が『ひまわり』フォルダにコピーされる。 - パッケージインストール後,config_bunrui.xml が読み込まれる。 *** 『青空文庫』パッケージ [#vddb70a6] Corpora/Aozora config_aozora.xml config_aozora.db.xml - パッケージの Corpora/Aozora, config_aozora.xml, config_aozora_db.xml が『ひまわり』フォルダにコピーされる。 - パッケージインストール後,config_aozora.xml が読み込まれる。