#author("2022-10-11T16:01:40+09:00","default:rd","rd") #author("2022-10-11T16:01:48+09:00","default:rd","rd") [[UniDic]] --2022/04/01 このページは更新は終了しています。UniDicの情報は[[こちらのページ>http://clrd.ninjal.ac.jp/unidic]]をご覧ください。 http://clrd.ninjal.ac.jp/unidic -2022/04/01 このページは更新は終了しています。UniDicの情報は[[こちらのページ>http://clrd.ninjal.ac.jp/unidic]]をご覧ください。 http://clrd.ninjal.ac.jp/unidic //-''2017/11/01 2017年8月よりUniDicの情報をまとめた新しいサイトがオープンしました。今後はこちらのページをご覧ください。 http://unidic.ninjal.ac.jp/ このページは更新は終了します。'' //-''&color(red){new!}; 2014/03/31 中古和文UniDic Ver.1.4 を公開しました。[[日本語歴史コーパス>http://www.ninjal.ac.jp/corpus_center/chj/]]平安時代編の構築に用いられた辞書です。'' [[近代文語UniDic>UniDic/近代文語UniDic]] 1.4と同期しています。 //-''&color(red){new!}; 2012/12/06 中古和文UniDic Ver.1.3 を公開しました。'' [[近代文語UniDic>UniDic/近代文語UniDic]] 1.3と同期しています。 //&color(red){2010/10/21 ''中古和文UniDic'' ''Ver.0.5''(Windowsパッケージ及びMeCab用バイナリ辞書)をリリースしました。}; //-2012/05/02 中古和文UniDic Ver.1.2 を公開しました。近代文語UniDic 1.2と同期しています。 -2012/05/02 科研費報告書『和文系資料を対象とした形態素解析辞書の開発』(2012),『中古和文UniDic 短単位規程集』(2012)のPDFを公開しました。 *形態素解析辞書 : 中古和文UniDic [#yd8044dd] -''&color(red){[[UniDicの情報をまとめた新しいサイト>https://clrd.ninjal.ac.jp/unidic/]]がオープンしました。このページの内容は古い情報です。今後は[[こちらのページ>https://clrd.ninjal.ac.jp/unidic/]]をご覧ください。 };'' -''&size(20){→https://clrd.ninjal.ac.jp/unidic/};'' ---- #contents **概要 [#y1c69572] -中古和文UniDicは、[[UniDic>http://download.unidic.org/]]をもとにして中古の和文系資料(いわゆる古典,古文)を解析できるようにした形態素解析辞書です。([[現代語版のUniDicはこちら>http://download.unidic.org/]]) -主として校訂済みの中古和文(仮名文学作品)を対象としています。他の種類のテキストでは必ずしも良い解析結果が得られません。 -MeCab版を公開しています(ChaSen版は公開していません)。 ***和文茶まめ(Windows版)画面 [#m51976c1] -手軽に解析を行うためのツール #ref(wabun_chamame05.png,,50%); ***解析精度比較 [#n80bfd11] -中古和文テキストの解析精度を他のUniDicと比較しました。 -テストデータは約2万5千語を文単位でランダムサンプリングしたものです(学習に利用せず,ただし中古和文UniDicにとっての未知語なし)。 #ref(wabun_compare05.png,,100%); **利用条件 [#u7300511] (現代語版UniDic 1.3.12と同等の内容です) ***中古和文UniDic 利用条件 [#c69318c2] +中古和文UniDic の著作権は,小木曽智信,小椋秀樹,田中牧郎,近藤明日子,須永哲矢 および The UniDic consortium(代表:伝康晴)が保持する。 +中古和文UniDic を複製又は改変することは,個人的な利用に限り認める。 +中古和文UniDic 及びこれを改変したものを再配布してはならない。 +中古和文UniDic を利用して行った研究等の成果を公表する場合は,中古和文UniDic を利用したことを明記すること。 +営利を目的として,中古和文UniDic を利用する場合は,事前に著作権者と協議すること。 +中古和文UniDic を利用することによって,直接的・間接的に生じたいかなる損害についても,著作権者は賠償する責任を負わない。 +本文書に定めのない事項については,著作権者と協議すること。 **ダウンロード [#gacaeebe] ***中古和文UniDicのダウンロード [#hb89ebc9] -''&color(red){本ページからのダウンロードサービスは終了しました。今後は[[こちらのページ>http://unidic.ninjal.ac.jp/]]をご覧ください。http://unidic.ninjal.ac.jp/};'' 恐れ入りますが,次のアンケートにお答えください。アンケート結果を送信するとダウンロードページに移動します。&br; なお,このアンケートは『中古和文UniDic』をどのような方にお使いいただいているかを調べるものです。お送りいただいた情報は,今後の研究・開発に利用させていただきます。 //#qa2w(kindai-corpus@ninjal.ac.jp,kindai-corpus@ninjal.ac.jp,[UniDic-EMJ_v14],所属:大学・高専等/小中高・専門学校等/研究機関/企業/個人/その他,身分:教職員/研究員/学生/その他,専門分野:日本語(国語)学/英語学/言語学/言語教育/自然言語処理・人工知能/その他(人文社会系)/その他(理工系),年齢:10代未満/10代/20代/30代/40代/50代/60代/70代以上,使用OS:Windows/Mac/Linux/その他,コンピュータ使用歴:1年未満/1年以上3年未満/3年以上5年未満/5年以上10年未満/10年以上) //***ソース辞書や旧バージョンの入手 [#gc04c43c] //ソース辞書(テキスト形式の配布辞書)や旧バージョンについては現在ダウンロードサービスを行っておりません。&br; //利用を希望される方は[[下記の連絡先>#q40aa90a]]までメールでお問い合わせください。 **インストール [#t3d833a8] -Windowsパッケージの場合は,ダウンロードしたファイルを解凍し,インストーラ(INSTALL.EXE)を起動して指示に従ってください。インストール終了後,「和文茶まめ」のアイコンから起動してください。 -利用するには「MeCab 0.96」以降が必要です。あらかじめインストールしておくか、中古和文UniDicをインストールした後ですぐにインストールしてください。 --MeCabは次のページからダウンロードできます。&br; http://code.google.com/p/mecab/downloads/list **科研費報告書 [#x77a8536] 平成21(2009)−平成23(2011)年度科学研究費補助金基盤研究(C)「和文系資料を対象とした形態素解析辞書の開発」 課題番号21520492 -[[報告書PDF『和文系資料を対象とした形態素解析辞書の開発』(2012) unidic-EMJ_report2012.pdf(15.5MB)>https://www.dropbox.com/s/kn1b0qfhfdd4i1g/unidic-EMJ_report2012.pdf?dl=1]] -[[規程集PDF『中古和文UniDic 短単位規程集』(2012) unidic-EMJ_rulebook2012.pdf(1.6MB)>https://www.dropbox.com/s/33w66i4ml0nllrh/unidic-EMJ_rulebook2012.pdf?dl=1]] (※内容が古くなっています) **参考文献 [#wf64f0f0] (中古和文UniDicに限らない)UniDic全般に関する参考文献については、[[UniDicダウンロードサイトのこちらのページ>https://www.tokuteicorpus.jp/dist/modules/system/modules/menu/main.php?page_id=2598&op=change_page]]をご覧ください。 -小木曽智信・小椋秀樹・田中牧郎・近藤明日子・伝康晴「中古和文を対象とした形態素解析辞書の開発」『情報処理学会研究報告 人文科学とコンピュータ』Vol.2010-CH-85(No.4) pp.1-8 2010年2月&br; [[→情報処理学会 電子図書館>http://id.nii.ac.jp/1001/00067615/]] -Toshinobu Ogiso, Mamoru Komachi, Yasuharu Den and Yuji Matsumoto. '''UniDic for Early Middle Japanese: a Dictionary for Morphological Analysis of Classical Japanese.''' In Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC): Posters, pp.911-915. Istanbul, Turkey, May 2012. http://www.lrec-conf.org/proceedings/lrec2012/pdf/906_Paper.pdf -小木曽智信「中古仮名文学作品の形態素解析」『日本語の研究』第9巻4号(通巻255号) pp.49-62,2013年10月 [[→CiNii>http://ci.nii.ac.jp/naid/40019825079]] **連絡先 [#q40aa90a] 中古和文UniDicに関するお問い合わせは次のアドレスにお願いします。&br; 小木曽智信 &ref(mail.png); **更新履歴 [#z11ce83f] -2017/11/01 更新を停止。今後は[[こちらのページ>http://unidic.ninjal.ac.jp/]]をご覧ください。http://unidic.ninjal.ac.jp/ -2014/03/31 中古和文UniDic Ver.1.4 Windows版パッケージを公開。 -2012/12/06 中古和文UniDic Ver.1.3 Windows版パッケージを公開。 -2012/05/02 中古和文UniDic Ver.1.2 Windows版パッケージを公開。 -2012/05/02 科研費報告書『和文系資料を対象とした形態素解析辞書の開発』(2012),『中古和文UniDic 短単位規程集』(2012)のPDFを公開。 -2010/10/21 中古和文UniDic Ver.0.5 Windows版パッケージ及びMeCab用バイナリ辞書を公開。 **謝辞 [#a4c5d9e5] 中古和文UniDicの開発にあたっては次の研究補助金・助成金等を受けました。 -[[日本学術振興会科学研究費補助金(基盤研究(C))「和文系資料を対象とした形態素解析辞書の開発」(平成21〜23年度,代表者:小木曽智信)>http://kaken.nii.ac.jp/ja/p/21520492]] -国立国語研究所・共同研究プロジェクト(平成22〜25年)&br;「統計と機械学習による日本語史研究」(プロジェクトリーダー:小木曽智信) &br;http://www.ninjal.ac.jp/research/project/c/statisticsja/ なお、この辞書の元となった[[UniDic>http://download.unidic.org/]]は、文部科学省科学研究費補助金特定領域研究「代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備」(平成18〜22年度,領域代表者:国立国語研究所・前川喜久雄)ほかの助成を受けて開発が行われたものです。