本パッケージは,『Wikipedia日本語版』の記事(88万)を『ひまわり』用にインポートしたデータです。
Corpora フォルダ ... 『Wikipedia』データを格納したフォルダ config_wikipedia.xml ... 設定ファイル (01 / 09 の場合) config_wikipedia_all.xml ... 設定ファイル (02〜09 / 09 の場合⇒01 〜 09 / 09 が検索対象になります)
以上で,インストールは終了です。
なお,インストール直後は,01/09版はconfig_wikipedia.xml,02〜09/09 版は,config_wikipedia_all.xml が『ひまわり』に読み込まれた状態になります。
記事の著者,Wikipedia の運営者の方々,Wikipedia Extractorの著者に心より感謝いたします。