[[全文検索システム『ひまわり』]]
&color(red){&size(25){本ページは構築中です。};};
RIGHT:作成者:山口昌也 (国立国語研究所)
RIGHT:2018-xx-xx
#br
*『青空文庫TOP100』パッケージの概要 [#ec8e3188]
本パッケージは,[[『青空文庫』>http://www.aozora.gr.jp/]]の[[アクセスランキング>http://www.aozora.gr.jp/access_ranking/]](2009-2017)からアクセス数上位100作品を抽出し,[[『ひまわり』>全文検索システム『ひまわり』]]用にインポートしたデータです。
- 使い方は,[[『青空文庫』パッケージ>../『青空文庫』パッケージ]]と同じです。
- [[『青空文庫』パッケージ>../『青空文庫』パッケージ]]では,追加パッケージだった,形態素解析結果のアノテーションも同梱しています。
次のような利用方法を想定して,作成しました。
- 『ひまわり』で検索の練習がしたい。
- [[『青空文庫』パッケージ>../『青空文庫』パッケージ]]を使う前に,試してみたい。
*収録データの内容 [#o33facbc]
- サイト:[[『青空文庫』>http://www.aozora.gr.jp/]]
- 収録作品
-- [[青空文庫アクセスランキング>http://www.aozora.gr.jp/access_ranking/]](2009-2017,XHTML版,[[全年合計結果]])のアクセス数&ref(./,上位100冊);です。
-- ダウンロード後,[[『青空文庫』パッケージ>../『青空文庫』パッケージ]]と同様の方法で『ひまわり』にインポートしています。
-- 注記
--- 底本が複数ある作品は,アクセスランキングが上位の作品のみ収録しています。
--- 上下巻など分冊されている作品は,ランキングに入っている冊のみ収録しています。
--- 「[[萩原 朔太郎:月に吠える>http://www.aozora.gr.jp/cards/000067/files/859_21656.html]]」は,XHMLファイルがwell-formedでないので,修正した後,収録しています(&ref(./859_21656.html.patch,patch);)。
*使用条件 [#te59028f]
- 本パッケージの使用条件は,[[青空文庫収録ファイルの取り扱い規準>http://www.aozora.gr.jp/guide/kijyunn.html]]に準じます。
- 本ページで公開しているパッケージを利用したことにより直接的,間接的に生じる,いかなる損害も保証しません。
*ダウンロード [#g26eb865]
//- [[『青空文庫TOP100』パッケージ(2018xxxx)>http://csd.ninjal.ac.jp/archives/Aozora/aozora_himawari_20171001.zip]](圧縮時約811MB,解凍時約1.2GB, ZIP形式,[[履歴・旧バージョン>./履歴]])
*使用方法 [#lcd27131]
** インストール方法 [#ad87ca23]
+ [[『ひまわり』>全文検索システム『ひまわり』]](ver.1.6以降)をインストールしてください。
+ 『青空文庫』パッケージをダウンロードし,ダウンロードしたzipファイルを『ひまわり』にドラッグ&ドロップするか,[ファイル]⇒[インストール]で指定して下さい。
以上で,インストールは終了です。
// 次回以降は,『ひまわり』フォルダにインストールされた設定ファイル(config_aozora.xmlかconfig_aozora_db.xmlなど)を以下「検索」の説明にしたがって読み込んで下さい。
** 検索 [#xd38c47d]
// 『ひまわり』を起動し,[ファイル]→[新規]やドラッグ&ドロップで,『ひまわり』フォルダにある設定ファイル(config_aozora.xmlかconfig_aozora_db.xml) を読み込んでください。なお,設定ファイルは,上記のとおり,2種類を収録していますので,適宜使い分けてください。検索結果の時に詳しい検索方法については,全文検索システム『ひまわり』の利用者マニュアルを参照してください。
//-書誌情報は,基本的に[[「作家別作品一覧拡充版」>http://www.aozora.gr.jp/index_pages/list_person_all_extended_utf8.zip]](2016-04-01時点のデータを使用。リンク先は現在のものなので注意)に準じます。
//-- 「作家別作品一覧拡充版」から取り込んだ情報は,次のとおりです。なお,括弧内は,『ひまわり』の検索結果における欄名です。
//>>>作品ID,副題,初出,分類番号,文字遣い種別,姓(著者,*後述),名(著者,*後述),図書カードURL,人物ID,役割フラグ(役割),生年月日,没年月日,底本名1(底本名),底本出版社名1(底本出版社名),底本初版発行年1(底本初版発行年),入力に使用した版1(入力に使用した版),XHTML/HTMLファイルURL(ファイルURL)
//-- 検索結果の「著者」欄の内容は,「作家別作品一覧拡充版」の「姓」「名」欄を統合したものです。統合後,姓名の間は,空白で区切られます。また,例2のように,姓名がカタカナと記号からなる場合は,「名」「姓」の順に表示しています。
//---例1: 「芥川」「竜之介」 ⇒ 「芥川 竜之介」
//---例2: 「ポー」「エドガー・アラン」 ⇒ 「エドガー・アラン ポー」
//-- 「著者」欄などで複数の著者が入る場合は,「::」で区切られます。
//- 「文字数」欄は,当該の作品の「本文」に含まれる文字数です。ここで言う「本文」とは,青空文庫のXMLファイルの中から,冒頭の作品名,著者名,末尾の書誌情報・注記などを除いたテキスト部分です。半角空白や改行は,文字数に含まれていません。
//- 収録作品のリストは,[ツール]⇒[一覧]⇒[作品別書誌情報一覧]を実行して下さい。
*アンケート [#u7dd9448]
よろしければ,アンケートにもお答えください。なお,このアンケートは,『ひまわり』をどのような方にお使いいただいているかを調べ,今後の研究・開発に活用させていただくためのものです。アンケート結果は,これらの目的以外には利用いたしません。
#qa1(masaya,masaya,[himawari-aozora_top100],所属:大学・高専等/小中高・専門学校等/研究機関/企業/個人/その他,身分:教職員/研究員/学生/その他,専門分野:日本語(国語)学/英語学/言語学/言語教育/自然言語処理・人工知能/その他(人文社会系)/その他(理工系),母国語:日本語/日本語以外,年齢:10代未満/10代/20代/30代/40代/50代/60代/70代以上,使用OS:Windows/Mac/Linux/その他,コンピュータ使用歴:1年未満/1年以上3年未満/3年以上,:TEXTAREA:ご意見・ご感想:3:81)
*謝辞 [#xc4d4323]
収録作品の著者の方々,有益なデータを提供してくださる青空文庫の運営者,工作員の方々に心より感謝いたします。