[PukiWiki]

『たんぽぽ』,『プリズム』/『たんぽぽ』 の変更点

Top/『たんぽぽ』,『プリズム』/『たんぽぽ』

  • 追加された行はこの色です。
  • 削除された行はこの色です。
  • 『たんぽぽ』,『プリズム』/『たんぽぽ』 へ行く。
  • 『たんぽぽ』,『プリズム』/『たんぽぽ』 の差分を削除

[[『たんぽぽ』,『プリズム』]]

*『たんぽぽ』 [#tanpopo]
#ref(tanphoto.jpg,right,around)

『たんぽぽ』は[[「雑誌コーパスXML文書」>../雑誌コーパスの文書定義]]を直接検索するためのツールです。
Internet Explorer 6以降がインストールされたWindows環境で動作します。

雑誌コーパスXML文書は[[『太陽コーパス』>http://www.kokken.go.jp/lrc/index.php?%C2%C0%CD%DB%A5%B3%A1%BC%A5%D1%A5%B9]]で採用されている形式です。詳しくは[[雑誌コーパスの文書定義>../雑誌コーパスの文書定義]]をご覧ください。

『たんぽぽ』にはサンプルとして次の記事のXMLファイルを同梱しています。
>川上眉山「黄昏」『太陽』1901年04号,pp.81-90

#clear

**著作権 [#license]
+『たんぽぽ』の著作権は,独立行政法人 国立国語研究所が保持します。 
+本ページでは,GPL ライセンスに基づいて,このパッケージを配布しています。 GPLライセンスについてはリンク先(http://www.gnu.org/licenses/gpl.ja.html)をご覧ください。

**ダウンロード [#download]

次のファイルをダウンロードしてください。lzh形式で圧縮されています。
-&ref(Tanpopo2a.lzh);  雑誌コーパスXML本文検索ツール『たんぽぽ』2.0a(サンプル記事付き)

*使い方 [#howto]
※以下の説明画面では,本パッケージには同梱されていないXML文書(『女学雑誌』1894年刊)を使用しています。『女学雑誌』のXML文書は日本学術振興会科学研究費の助成を受け,国立国語研究所で作成中のもので,2006年に公開予定です。
※以下の説明画面では,本パッケージには同梱されていないXML文書(『女学雑誌』1894年刊)を使用しています。『女学雑誌』のXML文書は[[『近代女性雑誌コーパス』>http://www.kokken.go.jp/lrc/index.php?%B6%E1%C2%E5%BD%F7%C0%AD%BB%A8%BB%EF%A5%B3%A1%BC%A5%D1%A5%B9]]の一部です。詳しくは[[リンク先>http://www.kokken.go.jp/lrc/index.php?%B6%E1%C2%E5%BD%F7%C0%AD%BB%A8%BB%EF%A5%B3%A1%BC%A5%D1%A5%B9]]をご覧ください。

**起動 [#start]
ダウンロードしたファイルを展開し,中にあるTanpopo2.htaをダブルクリックしてください。

&ref(tanpopo.png);

**利用手順 [#procedure]
+画面左側に表示されているXMLファイルから検索対象のファイルを選ぶ
--「Ctrl」キーまたは「Shift」キーを押しながらクリックすることで複数選択できます
+検索文字列を入力する
--検索文字列には正規表現が使えます
--[字体変換]ボタンで入力済み文字列の字体を旧字体などに変換できます
+必要に応じて「[[テキストの形式>#style]]」を選択する
+[検索]ボタンを押す
+見つかれば,検索結果が新しいウィンドウに表示されます
--検索結果のウィンドウは複数開いておくことができます

(操作方法が画面右下のメッセージ欄に表示されますので,指示に従ってください。また画面の「使い方」を押すと詳しい使い方が表示されます)


&ref(tanpopo_result.png);

***テキストの形式・踊り字を開く [#style]
-検索対象のテキストとして「ルビなしテキスト」「ルビ入りテキスト」「ルビを開いたテキスト」のいずれかを指定することができます。
-原文が「&ruby(ちよつと){一寸};&ruby(とお){通};りますよ」の場合,各形式は次のようになります。
|CENTER:テキストの形式|CENTER:検索対象となるテキスト|h
|ルビなしテキスト|一寸通りますよ|
|ルビ入りテキスト|一寸[ちよつと]通[とお]りますよ|
|ルビを開いたテキスト|ちよつととおりますよ|

-各形式での検索の例
--漢字で「一寸」と書かれた例すべて:ルビなしテキストで"一寸"
--「一寸」に「ちよつと」とルビがついている例:ルビ入りテキストで"一寸[ちよつと]"
--ひらがなで「ちよつと」と書かれた例すべて:ルビを開いたテキストで"ちよつと"

-「踊字をひらく」オプションをオンにすると,テキスト中の踊字(くの字点やゝゞヽヾ等)を対応する文字に置き換えます(例:こゝろ→こころ)。「ルビを開いたテキスト」の場合にも有効です(&ruby(こゝろ){心};→こころ)。

**補足 [#add]
-画面左側の「XMLファイル」には,雑誌コーパスXML文書以外のものが表示される場合があります(拡張子がXMLとなっているものがすべて表示されます)が,雑誌コーパスXML文書だけを検索対象として選択して下さい。
-『太陽コーパス』収録版とは次のような違いがあります。
--検索対象は画面左側の「XMLファイル」の中のファイル名で指定します。
--画面右側の[字体変換]機能が簡略化されています。
--検索結果が新しいウィンドウに開きます(そのため,複数の結果を一度に表示できます)
--検索結果のうち,ヒットした文字列がある文(s)が太字で表示されます。

**更新履歴 [#history]
|2006/05/10|不具合を修正し、Ver.2.0aとしました。|
|2005/07/08|たんぽぽ Ver.2.0 公開|

**利用イメージ[#ss]
#ref(tanpopo_ss_small.png,nolink)

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS