[[『たんぽぽ』,『プリズム』]] *『プリズム』 [#prism] 『プリズム』はXML文書をXSLTで手軽に変換するためのアプリケーションです。((対応したスタイルシートを用意すれば雑誌コーパス以外のXML文書も変換できます。)) Internet Explorer 6以降がインストールされたWindows環境で動作します。 配布パッケージには,[[雑誌コーパスXML文書>../雑誌コーパスの文書定義]]を変換するための[[XSLTスタイルシート>#xslt]]と,サンプルとして次の記事のXMLファイルを同梱しています。 >川上眉山「黄昏」『太陽』1901年04号,pp.81-90 **著作権 [#license] +『プリズム』および雑誌コーパスXML用スタイルシートの著作権は,独立行政法人国立国語研究所が保持します。 +本ページでは,GPL ライセンスに基づいて,このパッケージを配布しています。 GPLライセンスについてはリンク先(http://www.gnu.org/licenses/gpl.ja.html)をご覧ください。 **ダウンロード [#download] 『プリズム』と[[雑誌コーパスXML文書用XSLTスタイルシート>#xslt]],サンプルのXML文書をセットにしたパッケージです。 次のファイルをダウンロードしてください。lzh形式で圧縮されています。 -&ref(Prism2.lzh); XSLT変換ツール『プリズム』2.0([[雑誌コーパスXML文書用XSLTスタイルシート>#xslt]],サンプル記事付き) *使い方 [#howto] ※以下の説明画面では,本パッケージには同梱されていないXML文書(『女学雑誌』1894年刊)を使用しています。『女学雑誌』のXML文書は日本学術振興会科学研究費の助成を受け,国立国語研究所で作成中のもので,2006年に公開予定です。 ※以下の説明画面では,本パッケージには同梱されていないXML文書(『女学雑誌』1894年刊)を使用しています。『女学雑誌』のXML文書は[[『近代女性雑誌コーパス』>http://www.kokken.go.jp/lrc/index.php?%B6%E1%C2%E5%BD%F7%C0%AD%BB%A8%BB%EF%A5%B3%A1%BC%A5%D1%A5%B9]]の一部です。詳しくは[[リンク先>http://www.kokken.go.jp/lrc/index.php?%B6%E1%C2%E5%BD%F7%C0%AD%BB%A8%BB%EF%A5%B3%A1%BC%A5%D1%A5%B9]]をご覧ください。 **起動 [#start] ダウンロードしたファイルを展開し,中にあるPrism2.htaをダブルクリックして起動してください。~ (必ずXSLTファイルがあるフォルダで起動してください。) &ref(prism.png); **利用手順 [#procedure] ***変換結果を画面表示する場合 [#browse] 変換結果を画面に表示する場合には次の手順で操作して下さい。 +左側に表示されている,変換元となる「入力XMLファイル」を一つ選択する。 +中央の「適用するスタイル」から,変換結果がHTMLになるものを一つ選択する。 +右側の[変換(ブラウザで表示)]ボタンを押す。 ***変換結果をファイルに出力する場合 [#save] 変換結果を表示するのではなく,ファイルに出力する場合には次の手順で行って下さい。 +左側に表示されている,変換元となる「入力XMLファイル」を選択する。(「Ctrl」キーや「Shift」キーを押しながらクリックすることで複数選択できます) +中央の「適用するスタイル」を一つ選択する(どの形式でも可)。 +適切な出力拡張子を選択し,必要に応じて出力フォルダ・出力ファイル名を変更する。(「入力XMLファイル」を複数選択した場合には出力ファイル名は変更できません) +[変換(ファイルへ出力)]ボタンを押す。 (操作方法が画面上部のメッセージ欄に表示されますので,指示に従ってください。また,画面の「使い方」を押すと詳しい使い方が表示されます) ***補足 [#add] -「入力XMLファイル」はCtrlキー(Shiftキー)を押しながらマウスを左クリックすることで複数選択できます。このとき[変換(ブラウザで表示)]は使えません。また出力ファイル名も拡張子以外は変更できません(既定の名前になります)。 -入力ファイルを複数選択したとき,「単一ファイルに追加出力」チェックボックスをチェックすると変換結果が一つのファイルに出力されます。CSVやテキスト形式のファイルなどに利用して下さい。 -出力がHTML形式でないものはブラウザでは正しく表示されませんのでファイル出力を行って下さい。このとき,適切な拡張子を選択してください。 -ファイルに出力する場合には必ず書き込み可能なフォルダを指定して下さい(標準ではデスクトップが指定されます)。 -変換元ファイルにJIS外字がユニコードで入力されている場合,出力文字コードをShift_JISとして変換結果をファイルに出力すると,JIS外字が〓に置き換えられます。 -『太陽コーパス』収録版とは次のような違いがあります。 --変換結果を画面に表示する場合,変換を行うたびに次々と新しいウィンドウに表示されます。 --「単一ファイルに追加出力」する場合,すでに同名のファイルがあるときには,これを〜.bakという名前でバックアップした後,新しくファイルを出力します。 *雑誌コーパスXML文書用XSLTスタイルシート [#xslt] 『プリズム』の配布パッケージには雑誌コーパスXML文書用の次のXSLTスタイルシートが同梱されています((いずれのスタイルシートもXSLT 1.0に準拠しているので対応したXSLTプロセッサを用いればWindows以外の環境でも利用可能です。))。 |形式変換|Web閲覧用(HTML)|本文−DHTML |tx2dhtm.xsl| |~|~|本文−DHTML(行番号)|tx2dhtm2.xsl| |~|~|本文−シンプルなHTML|tx2html.xsl| |~|テキスト(TXT)|本文−プレーンテキスト|tx2text.xsl| |~|~|本文−プレーンテキスト(行番号)|tx2text2.xsl| |~|印刷用(LaTeX)|本文−pLaTeX本文|tx2latex.xsl| |~|~|本文−pLaTeX本文(行番号)|tx2latex2.xsl| |情報抽出|Web閲覧用(HTML)|外字一覧(コード順)HTML|htm_gaiji.xsl| |~|~|外字一覧(出現順)HTML|htm_gaijic.xsl| |~|~|記事情報HTML|htm_note.xsl| |~|~|注情報HTML|htm_kiji.xsl| |~|~|引用情報HTML|htm_quot.xsl| |~|表形式テキスト(CSV)|記事情報CSV|htm_note.xsl| |~|~|注情報CSV|htm_kiji.xsl| |~|~|引用情報CSV|htm_quot.xsl| |>|>|HTML変換用の共通書式(他のスタイルシートから呼び出す)|html_mod.xsl| 以上のファイルのほか,変換結果(HTML)のデザインを指定するzassi.cssが含まれています。 **利用イメージ [#ss] &ref(prism_ss_small.png);