『ひまわり』支援ツール/えだまめ/使い方/2
をテンプレートにして作成
開始行:
[[『えだまめ』の使い方>../]]
+[[準備>../1]]
+『えだまめ』で『ひまわり』用データを作る
+[[『ひまわり』でインデックスを作る>../3]]
+[[『ひまわり』で検索する>../4]]
*2.『えだまめ』で『ひまわり』用データを作る [#tb902b86]
準備したテキストデータを『ひまわり』用に変換します。
+ダウンロードしたedamame.hta((実際にはedamame_v20.htaのよ...
OSがWindows XP SP2以降の場合には、かならずセキュリティー...
&ref(edamame2.png,,75%);&br;&br;
+[元データがあるフォルダ]の[参照]ボタンを押して、変換した...
--例:フォルダ構造が次のようになっている場合に、近代の夏...
--検索対象にしたくないテキストファイルが指定したフォルダ...
---たとえばデスクトップに変換したいファイルをおいて、デス...
+[変換対象ファイル]を指定します。変換したいファイルの形式...
++テキスト・XHTMLを選んだ場合は[変換オプション]が表示され...
+必要に応じて[変換オプション]を指定します。
++[XHTMLファイルの変換]ではスタイルシートを選びます。
---青空文庫のXHTMLファイルを変換する場合にはxhtml2xml_aoz...
---一般のXHTMLファイルを変換する場合にはxhtml2xml.xslを選...
---[HMTLの変換を試みる]をチェックすると、XHTML以外のHTML...
++[テキストファイルの変換]では標準で青空文庫の形式が選ば...
---[改行文字の扱い]は改行(論理改行)の変換の仕方を指定し...
例:原文
吾輩は猫である
吾輩は猫である。名前は
まだない。・・・
:::論理改行タグに変換|改行文字を論理改行タグに置換します。
吾輩は猫である<b/><b/> 吾輩は猫である。名前は<b/>まだな...
:::「。」の後に論理改行タグを挿入|改行文字を物理改行タグ...
吾輩は猫である<行/><行/> 吾輩は猫である。<b/>名前はま...
:::空行を論理改行タグに変換)|改行文字が二つ続いた場合の...
吾輩は猫である<b/><行/> 吾輩は猫である。名前は<行/>まだ...
---[ふりがなの記号]でオプションを指定するとふりがな入りフ...
例えば&ref(ruby.png);という振り仮名付きの文字列が |枝豆...
&br;ふられる部分の開始位置を表す記号がない場合には、括弧...
---[注の記号]でオプションを指定すると、注の部分を変換して...
&br;''[#注の内容]'' は注全体が角括弧([])に囲まれて...
---ふりがなと注の両方を指定した場合、「ふりがなの中の注」...
&br;例:曇《くも[#原文くし]》
&br;例:曇《くも》[#原文は雲《くも》]り
+必要に応じて[コーパスデータの出力先]を変更します。通常は...
--変換結果の出力先フォルダを変更する場合には[参照]ボタン...
--[コーパス名](設定ファイルの名前や変換結果を保存するフ...
+[変換する]ボタンを押して下さい。変換・ファイル出力を実行...
--出力過程の記録が表示され、[検証する]ボタンが使えるよう...
&ref(edamame2_result.png,,50%);
+[検証する]ボタンを押して正しくできたか確認して下さい。
--異常があるとエラーが表示されます。変換元テキストデータ...
--正常であれば「〜〜corpus.xmlは整形式のXMLファイルです。...
+出力先(通常はデスクトップ)に次のようなファイルとフォル...
#ref(result_data.png,around)
--Corporaフォルダにはテキストデータを変換したXMLファイル...
--config_近代.xmlは『ひまわり』用の設定ファイルです。
#clear
***変換の詳細 [#v2d704ac]
-入力ファイルは指定したフォルダ以下にあるファイルです。文...
-出力されるコーパス(XMLファイル)はUTF-16LEエンコード、L...
----
#navi(../)
終了行:
[[『えだまめ』の使い方>../]]
+[[準備>../1]]
+『えだまめ』で『ひまわり』用データを作る
+[[『ひまわり』でインデックスを作る>../3]]
+[[『ひまわり』で検索する>../4]]
*2.『えだまめ』で『ひまわり』用データを作る [#tb902b86]
準備したテキストデータを『ひまわり』用に変換します。
+ダウンロードしたedamame.hta((実際にはedamame_v20.htaのよ...
OSがWindows XP SP2以降の場合には、かならずセキュリティー...
&ref(edamame2.png,,75%);&br;&br;
+[元データがあるフォルダ]の[参照]ボタンを押して、変換した...
--例:フォルダ構造が次のようになっている場合に、近代の夏...
--検索対象にしたくないテキストファイルが指定したフォルダ...
---たとえばデスクトップに変換したいファイルをおいて、デス...
+[変換対象ファイル]を指定します。変換したいファイルの形式...
++テキスト・XHTMLを選んだ場合は[変換オプション]が表示され...
+必要に応じて[変換オプション]を指定します。
++[XHTMLファイルの変換]ではスタイルシートを選びます。
---青空文庫のXHTMLファイルを変換する場合にはxhtml2xml_aoz...
---一般のXHTMLファイルを変換する場合にはxhtml2xml.xslを選...
---[HMTLの変換を試みる]をチェックすると、XHTML以外のHTML...
++[テキストファイルの変換]では標準で青空文庫の形式が選ば...
---[改行文字の扱い]は改行(論理改行)の変換の仕方を指定し...
例:原文
吾輩は猫である
吾輩は猫である。名前は
まだない。・・・
:::論理改行タグに変換|改行文字を論理改行タグに置換します。
吾輩は猫である<b/><b/> 吾輩は猫である。名前は<b/>まだな...
:::「。」の後に論理改行タグを挿入|改行文字を物理改行タグ...
吾輩は猫である<行/><行/> 吾輩は猫である。<b/>名前はま...
:::空行を論理改行タグに変換)|改行文字が二つ続いた場合の...
吾輩は猫である<b/><行/> 吾輩は猫である。名前は<行/>まだ...
---[ふりがなの記号]でオプションを指定するとふりがな入りフ...
例えば&ref(ruby.png);という振り仮名付きの文字列が |枝豆...
&br;ふられる部分の開始位置を表す記号がない場合には、括弧...
---[注の記号]でオプションを指定すると、注の部分を変換して...
&br;''[#注の内容]'' は注全体が角括弧([])に囲まれて...
---ふりがなと注の両方を指定した場合、「ふりがなの中の注」...
&br;例:曇《くも[#原文くし]》
&br;例:曇《くも》[#原文は雲《くも》]り
+必要に応じて[コーパスデータの出力先]を変更します。通常は...
--変換結果の出力先フォルダを変更する場合には[参照]ボタン...
--[コーパス名](設定ファイルの名前や変換結果を保存するフ...
+[変換する]ボタンを押して下さい。変換・ファイル出力を実行...
--出力過程の記録が表示され、[検証する]ボタンが使えるよう...
&ref(edamame2_result.png,,50%);
+[検証する]ボタンを押して正しくできたか確認して下さい。
--異常があるとエラーが表示されます。変換元テキストデータ...
--正常であれば「〜〜corpus.xmlは整形式のXMLファイルです。...
+出力先(通常はデスクトップ)に次のようなファイルとフォル...
#ref(result_data.png,around)
--Corporaフォルダにはテキストデータを変換したXMLファイル...
--config_近代.xmlは『ひまわり』用の設定ファイルです。
#clear
***変換の詳細 [#v2d704ac]
-入力ファイルは指定したフォルダ以下にあるファイルです。文...
-出力されるコーパス(XMLファイル)はUTF-16LEエンコード、L...
----
#navi(../)
ページ名: