[[UniDic]] &color(red){準備中}; //&color(red){2010/10/21 ''中古和文UniDic'' ''Ver.0.5''(Windowsパッケージ及びバイナリ辞書)をリリースしました。}; *形態素解析辞書 : 中古和文UniDic [#yd8044dd] RIGHT:''小木曽 智信'' #contents **概要 [#y1c69572] -中古和文UniDicは、[[UniDic>http://download.unidic.org/]]をもとにして中古の和文系資料を解析できるようにした形態素解析辞書です。([[現代語版のUniDicはこちら>http://download.unidic.org/]]) -主として校訂済みの中古和文(仮名文学作品)を対象としています。他の種類のテキストでは必ずしも良い解析結果が得られません。 -MeCab版を公開しています(ChaSen版は公開していません)。 ***近代茶まめ(Windows版)画面 [#m51976c1] #ref(wabun_chamame05.png,,50%); ***解析精度比較 [#n80bfd11] -中古和文テキストの解析精度を他のUniDicと比較しました。テストデータは約2万5千語を文単位でランダムサンプリングしたものです(学習に利用せず,ただし中古和文UniDicにとっては未知語なし)。 #ref(wabun_compare05.png,,100%); **利用条件 [#u7300511] (現代語版UniDicと同等の内容です) ***中古和文UniDic ver.0.5 利用条件 [#c69318c2] +中古和文UniDic ver.0.5 の著作権は,小木曽智信,小椋秀樹,田中牧郎,近藤明日子,須永哲矢 および The UniDic consortium(代表:伝康晴)が保持する。 +中古和文UniDic ver.0.5 を複製又は改変することは,個人的な利用に限り認める。 +中古和文UniDic ver.0.5 及びこれを改変したものを再配布してはならない。 +中古和文UniDic ver.0.5 を利用して行った研究等の成果を公表する場合は,中古和文UniDic ver.0.5 を利用したことを明記すること。 +営利を目的として,中古和文UniDic ver.0.5 を利用する場合は,事前に著作権者と協議すること。 +中古和文UniDic ver.0.5 を利用することによって,直接的・間接的に生じたいかなる損害についても,著作権者は賠償する責任を負わない。 +本文書に定めのない事項については,著作権者と協議すること。 **ダウンロード [#gacaeebe] ***中古和文UniDicのダウンロード [#hb89ebc9] 恐れ入りますが,次のアンケートにお答えください。アンケート結果を送信するとダウンロードページに移動します。&br; なお,このアンケートは『中古和文UniDic』をどのような方にお使いいただいているかを調べるものです。お送りいただいた情報は,今後の研究・開発に利用させていただきます。 -準備中 //#qa2w(kindai-corpus@ninjal.ac.jp,kindai-corpus@ninjal.ac.jp,[UniDic-CWJ_v11],所属:大学・高専等/小中高・専門学校等/研究機関/企業/個人/その他,身分:教職員/研究員/学生/その他,専門分野:日本語(国語)学/英語学/言語学/言語教育/自然言語処理・人工知能/その他(人文社会系)/その他(理工系),年齢:10代未満/10代/20代/30代/40代/50代/60代/70代以上,使用OS:Windows/Mac/Linux/その他,コンピュータ使用歴:1年未満/1年以上3年未満/3年以上5年未満/5年以上10年未満/10年以上) ***ソース辞書や旧バージョンの入手 [#gc04c43c] ソース辞書(テキスト形式の配布辞書)やChaSen版,旧バージョンについては現在ダウンロードサービスを行っておりません。&br; 利用を希望される方は[[下記の連絡先>#q40aa90a]]までメールでお問い合わせください。 **インストール [#t3d833a8] -Windowsパッケージの場合は,ダウンロードしたファイルを解凍し,インストーラ(INSTALL.EXE)を起動して指示に従ってください。インストール終了後,「和文茶まめ」のアイコンから起動してください。 -利用するには「MeCab 0.96」以降以降が必要です。あらかじめインストールしておくか、中古和文UniDicをインストールした後ですぐにインストールしてください。 --MeCabは次のページからダウンロードできます。&br; http://mecab.sourceforge.net/#download **参考文献 [#wf64f0f0] (中古和文UniDicに限らない)UniDic全般に関する参考文献については、[[UniDicダウンロードサイトのこちらのページ>https://www.tokuteicorpus.jp/dist/modules/system/modules/menu/main.php?page_id=2598&op=change_page]]をご覧ください。 ***学会発表 [#n02053df] -「中古和文を対象とした形態素解析辞書の開発」小木曽智信・小椋秀樹・田中牧郎・近藤明日子・伝康晴『情報処理学会研究報告 人文科学とコンピュータ』Vol.2010-CH-85(No.4) 1-8 2010年2月 [[情報処理学会 電子図書館>http://id.nii.ac.jp/1001/00067615/]] -「中古和文を対象とした形態素解析辞書の開発」小木曽智信・小椋秀樹・田中牧郎・近藤明日子・伝康晴『情報処理学会研究報告 人文科学とコンピュータ』Vol.2010-CH-85(No.4) 1-8 2010年2月 --[[→情報処理学会 電子図書館>http://id.nii.ac.jp/1001/00067615/]] -「形態素解析辞書「中古和文UniDic」とその活用例」 小木曽智信・小椋秀樹・近藤明日子・須永哲矢 『日本語学会2010年度秋季大会予稿集』 pp.243-248 2010年10月 **連絡先 [#q40aa90a] 近代文語UniDicに関するお問い合わせは次のアドレスにお願いします。&br; 小木曽智信 &ref(mail.png); **更新履歴 [#z11ce83f] -2010/10/21 中古和文UniDic Ver.0.5 Windows版パッケージ及びMeCab版バイナリ辞書を公開。 **謝辞 [#a4c5d9e5] -本辞書の開発には,日本学術振興会科学研究費補助金(基盤研究(C))「和文系資料を対象とした形態素解析辞書の開発」(平成21〜23年度,代表者:小木曽智信)による補助を得ました。 なお、この辞書の元となった[[UniDic>http://www.tokuteicorpus.jp/dist/]]は、文部科学省科学研究費補助金特定領域研究「代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備」(平成18〜22年度,領域代表者:国立国語研究所・前川喜久雄)ほかの助成を受けて開発が行われているものです。詳しくは[[リンク先>http://www.tokuteicorpus.jp/dist/]]をご覧ください。