全文検索システム『ひまわり』/利用者マニュアル/1_5/5.言語資料をインポートする
をテンプレートにして作成
開始行:
#navi(../)
//&color(red){&size(20){本ページは作成中です。};};
*5. 言語資料を『ひまわり』で検索できるようにする [#q7e098...
** 5.1 一般的な手順 [#ldb6e87b]
『ひまわり』は,テキストファイル,HTML, XHTML,XML な...
*** 5.1.1 言語資料の準備 [#g2927b9f]
まず,インポートする言語資料を一つのフォルダにまとめま...
#ref(./dir_structure.png,center,wrap)
言語資料を集める際は,次のことに留意してください。
- ファイル名の末尾は,ファイル形式に応じて,次のようにつ...
-- .txt ... タグ付けされてない生のテキストファイル
-- .html ... または .htm: HTML,XHTML ファイル
-- .xml ... XML ファイル
- 言語資料の文字コードは,自動判別します。
*** 5.1.2 インポートの実行 [#v9f285bd]
『ひまわり』のメニューから[ファイル]⇒[インポート]を実行...
#ref(./import_menu.png,center,wrap)
次のウィンドウが現れたら,「参照」ボタンを押して,言語...
#ref(./import_default.png,center,wrap)
そのままでよければ,「インポート」ボタンを押してくださ...
インポート処理が終わると,次のようなウィンドウがでれば...
*** 5.1.3 言語資料の利用 [#n1f92a00]
まずは,処理途中でエラーが出ていないか確認します。どの...
インポート直後から,検索できる状態になります。検索方法...
インポートした言語資料の設定ファイルとして,次の二つの...
:config_コーパス名.xml|この設定が,インポート直後に読み込...
:config_コーパス名.db.xml|config_コーパス名.xmlの設定に加...
** 5.2 インポートの詳細 [#jb30557d]
*** 5.2.1 詳細オプション [#u80fa283]
インポート時に詳細な設定は,は,詳細オプション(5.1.2 節...
#ref(./import_option.png,center,wrap)
:変換対象ファイル|変換対象のファイルの種類を設定します。
:文字正規化|変換時の文字正規化処理の種類を設定します。
-- ''なし:'' 正規化処理は基本的に行いません。ただし,変換...
-- ''ユーザ定義:'' ユーザが定義した変換規則に基づいて,文...
-- ''NFKC (Unicode):'' Unicode で定義されている正規化方式...
:テキスト変換|テキストファイル中の文字列を変換するための...
:XHTMLファイル用スタイルシート|XHTMLファイルを変換するた...
:XMLファイル用スタイルシート|XMLファイルを変換するための...
*** 5.2.1 生テキストファイルのインポート [#v9e1b6fa]
生テキストファイルをインポートする際の詳細設定について...
インポートするファイルの中に,生テキストファイルが含ま...
生テキストファイルのインポートに関連するオプションは,...
テキスト変換オプションで指定する変換規則は,aozora.htd ...
:《》:ルビ|(例)坊《ぼ》っちゃん
:|:ルビの付く文字列の始まりを特定する記号|(例)夕方|...
:[#]:入力者注 主に外字の説明や,傍点の位置の指定|(...
aozora.htd は,(『ひまわり』フォルダ)/resource/htd/ ...
*** 5.2.2 HTML,XHTML ファイルのインポート [#gaa62316]
HTML,XHTML ファイルをインポートする場合は,変換オプシ...
インポート時のオプションには,「文字正規化」「XHTMLファ...
「XHTMLファイル用スタイルシート」は,デフォルトで次の二...
:xhtml2xml.xsl|XHTML 汎用のスタイルシートです。
:xhtml2xml_aozora.xsl|青空文庫専用スタイルシートです。『...
HTML ファイルの場合,そのままではスタイルシートは適用で...
*** 5.2.3 XML ファイルのインポート [#e9a0146e]
HTML,XHTML ファイルをインポートする場合は,変換オプシ...
インポート時のオプションとして,XHTML ファイル用のスタ...
スタイルシートを指定しなければ,そのまま変換せずにイン...
** 5.3 『ひまわり』用資料のインストール [#z13d3da4]
*** 5.3.1 『ひまわり』用パッケージの場合 [#c9f432c8]
『ひまわり』用にパッケージングされた資料は,「インスト...
+ パッケージファイルを解凍して下さい。
+ [ファイル]→[インストール]を実行し,解凍結果のフォルダを...
+ 成功すると,コピーしたファイルが表示されて,パッケージ...
#navi(../)
終了行:
#navi(../)
//&color(red){&size(20){本ページは作成中です。};};
*5. 言語資料を『ひまわり』で検索できるようにする [#q7e098...
** 5.1 一般的な手順 [#ldb6e87b]
『ひまわり』は,テキストファイル,HTML, XHTML,XML な...
*** 5.1.1 言語資料の準備 [#g2927b9f]
まず,インポートする言語資料を一つのフォルダにまとめま...
#ref(./dir_structure.png,center,wrap)
言語資料を集める際は,次のことに留意してください。
- ファイル名の末尾は,ファイル形式に応じて,次のようにつ...
-- .txt ... タグ付けされてない生のテキストファイル
-- .html ... または .htm: HTML,XHTML ファイル
-- .xml ... XML ファイル
- 言語資料の文字コードは,自動判別します。
*** 5.1.2 インポートの実行 [#v9f285bd]
『ひまわり』のメニューから[ファイル]⇒[インポート]を実行...
#ref(./import_menu.png,center,wrap)
次のウィンドウが現れたら,「参照」ボタンを押して,言語...
#ref(./import_default.png,center,wrap)
そのままでよければ,「インポート」ボタンを押してくださ...
インポート処理が終わると,次のようなウィンドウがでれば...
*** 5.1.3 言語資料の利用 [#n1f92a00]
まずは,処理途中でエラーが出ていないか確認します。どの...
インポート直後から,検索できる状態になります。検索方法...
インポートした言語資料の設定ファイルとして,次の二つの...
:config_コーパス名.xml|この設定が,インポート直後に読み込...
:config_コーパス名.db.xml|config_コーパス名.xmlの設定に加...
** 5.2 インポートの詳細 [#jb30557d]
*** 5.2.1 詳細オプション [#u80fa283]
インポート時に詳細な設定は,は,詳細オプション(5.1.2 節...
#ref(./import_option.png,center,wrap)
:変換対象ファイル|変換対象のファイルの種類を設定します。
:文字正規化|変換時の文字正規化処理の種類を設定します。
-- ''なし:'' 正規化処理は基本的に行いません。ただし,変換...
-- ''ユーザ定義:'' ユーザが定義した変換規則に基づいて,文...
-- ''NFKC (Unicode):'' Unicode で定義されている正規化方式...
:テキスト変換|テキストファイル中の文字列を変換するための...
:XHTMLファイル用スタイルシート|XHTMLファイルを変換するた...
:XMLファイル用スタイルシート|XMLファイルを変換するための...
*** 5.2.1 生テキストファイルのインポート [#v9e1b6fa]
生テキストファイルをインポートする際の詳細設定について...
インポートするファイルの中に,生テキストファイルが含ま...
生テキストファイルのインポートに関連するオプションは,...
テキスト変換オプションで指定する変換規則は,aozora.htd ...
:《》:ルビ|(例)坊《ぼ》っちゃん
:|:ルビの付く文字列の始まりを特定する記号|(例)夕方|...
:[#]:入力者注 主に外字の説明や,傍点の位置の指定|(...
aozora.htd は,(『ひまわり』フォルダ)/resource/htd/ ...
*** 5.2.2 HTML,XHTML ファイルのインポート [#gaa62316]
HTML,XHTML ファイルをインポートする場合は,変換オプシ...
インポート時のオプションには,「文字正規化」「XHTMLファ...
「XHTMLファイル用スタイルシート」は,デフォルトで次の二...
:xhtml2xml.xsl|XHTML 汎用のスタイルシートです。
:xhtml2xml_aozora.xsl|青空文庫専用スタイルシートです。『...
HTML ファイルの場合,そのままではスタイルシートは適用で...
*** 5.2.3 XML ファイルのインポート [#e9a0146e]
HTML,XHTML ファイルをインポートする場合は,変換オプシ...
インポート時のオプションとして,XHTML ファイル用のスタ...
スタイルシートを指定しなければ,そのまま変換せずにイン...
** 5.3 『ひまわり』用資料のインストール [#z13d3da4]
*** 5.3.1 『ひまわり』用パッケージの場合 [#c9f432c8]
『ひまわり』用にパッケージングされた資料は,「インスト...
+ パッケージファイルを解凍して下さい。
+ [ファイル]→[インストール]を実行し,解凍結果のフォルダを...
+ 成功すると,コピーしたファイルが表示されて,パッケージ...
#navi(../)
ページ名: