#author("2022-10-11T16:00:42+09:00","default:rd","rd") #author("2022-10-11T16:02:18+09:00","default:rd","rd") [[UniDic]] -2022/04/01 このページは更新は終了しています。UniDicの情報はこちらのページをご覧ください。 http://clrd.ninjal.ac.jp/unidic -2022/04/01 このページは更新は終了しています。UniDicの情報は[[こちらのページ>http://clrd.ninjal.ac.jp/unidic]]をご覧ください。 http://clrd.ninjal.ac.jp/unidic //-2017/11/01 2017年8月よりUniDicの情報をまとめた新しいサイトがオープンしました。今後はこちらのページをご覧ください。 http://unidic.ninjal.ac.jp/ このページは更新は終了します。 //-''&color(red){new!}; 2014/03/31 近代文語UniDic Ver.1.4 を公開しました。''[[中古和文UniDic>UniDic/中古和文UniDic]] 1.4と同期しています。 //-''&color(red){new!}; 2012/12/06 近代文語UniDic Ver.1.3 を公開しました。''[[明六雑誌コーパス>http://www.ninjal.ac.jp/corpus_center/cmj/meiroku/]]の語彙が追加されています。[[中古和文UniDic>UniDic/中古和文UniDic]] 1.3と同期しています。 //-2012/05/02 近代文語UniDic Ver.1.2 を公開しました。中古和文UniDic 1.2と同期しています。 -2012/05/02 科研費報告書『近代文語文を対象とした形態素解析のための電子化辞書の作成とその活用』(2009)のPDFを公開しました。 //''2009/08/14 近代文語UniDic Ver.1.1 を公開しました。現代語版UniDic 1.3.12と同期しています。''((今後は現代語版UniDicのアップデートにあわせて、近代文語UniDicも少しずつ更新していきます。)) //''2009/03/31 近代文語UniDic Ver.1.0 を公開しました。''((今後は現代語版UniDicのアップデートにあわせて、近代文語UniDicも少しずつ更新していく予定です。)) //''&color(red){new!}; 2008/11/30 近代文語UniDic Ver.0.9 を公開しました。'' //&color(red){2008/08/01 ''近代文語UniDic'' ''Ver.0.8''(Windowsパッケージ及びバイナリ辞書)をリリースしました。}; *形態素解析辞書 : 近代文語UniDic [#yd8044dd] -''&color(red){[[UniDicの情報をまとめた新しいサイト>https://clrd.ninjal.ac.jp/unidic/]]がオープンしました。このページの内容は古い情報です。今後は[[こちらのページ>https://clrd.ninjal.ac.jp/unidic/]]をご覧ください。 };'' -''&size(20){→https://clrd.ninjal.ac.jp/unidic/};'' ---- #contents **概要 [#y1c69572] -近代文語UniDicは、[[UniDic>http://download.unidic.org/]]をもとにして近代文語文を解析できるようにした形態素解析辞書です。([[現代語版のUniDicはこちら>http://download.unidic.org/]]) //-今後さまざまな変更を加えた上で,2008年度中に完成版(Ver.1.0)を公開する予定です。 -主として近代の論説文(明治普通文)を対象としています。文学作品や他の時代のテキストでは必ずしも良い解析結果が得られません。 -MeCab版とChaSen版を公開しています(Windows用パッケージは両方の辞書を同梱)が、解析精度が高いMeCab版の使用をお勧めします。 ***近代茶まめ(Windows版)画面 [#m51976c1] #ref(kindai_chamame08.png,,50%); ***解析結果サンプル((いずれも解析器にMeCabを使って,未知のデータを解析したもの。人手修正なし。)) [#me816392] -[[UniDic/近代文語UniDic/解析例]] -[[北村透谷「内部生命論」(青空文庫)>http://www.aozora.gr.jp/cards/000157/card43443.html]] &ref(naibu_v10.txt); --参考(旧バージョンによる解析結果):&ref(naibu_v09.txt);|&ref(naibu_v08.csv);|&ref(naibu_v07.csv); --参考(近代文語文以外の解析例):&ref(taketori_v10.txt);(竹取物語冒頭) **利用条件 [#u7300511] (現代語版UniDic 1.3.12と同等の内容です) ***近代文語UniDic 利用条件 [#c69318c2] +近代文語UniDic の著作権は,小木曽智信,小椋秀樹,近藤明日子 および The UniDic consortium(代表:伝康晴)が保持する。 +近代文語UniDic を複製又は改変することは,個人的な利用に限り認める。 +近代文語UniDic 及びこれを改変したものを再配布してはならない。 +近代文語UniDic を利用して行った研究等の成果を公表する場合は,近代文語UniDic ver.1.3 を利用したことを明記すること。 +営利を目的として,近代文語UniDic を利用する場合は,事前に著作権者と協議すること。 +近代文語UniDic を利用することによって,直接的・間接的に生じたいかなる損害についても,著作権者は賠償する責任を負わない。 +本文書に定めのない事項については,著作権者と協議すること。 **ダウンロード [#gacaeebe] ***近代文語UniDicのダウンロード [#hb89ebc9] -''&color(red){本ページからのダウンロードサービスは終了しました。今後は[[こちらのページ>http://unidic.ninjal.ac.jp/]]をご覧ください。http://unidic.ninjal.ac.jp/};'' 恐れ入りますが,次のアンケートにお答えください。アンケート結果を送信するとダウンロードページに移動します。&br; なお,このアンケートは『近代文語UniDic』をどのような方にお使いいただいているかを調べるものです。お送りいただいた情報は,今後の研究・開発に利用させていただきます。 //#qa2(kindai-corpus@ninjal.ac.jp,kindai-corpus@ninjal.ac.jp,[UniDic-MLJ_v14],所属:大学・高専等/小中高・専門学校等/研究機関/企業/個人/その他,身分:教職員/研究員/学生/その他,専門分野:日本語(国語)学/英語学/言語学/言語教育/自然言語処理・人工知能/その他(人文社会系)/その他(理工系),年齢:10代未満/10代/20代/30代/40代/50代/60代/70代以上,使用OS:Windows/Mac/Linux/その他,コンピュータ使用歴:1年未満/1年以上3年未満/3年以上5年未満/5年以上10年未満/10年以上) //***ソース辞書や旧バージョンの入手 [#gc04c43c] //ソース辞書(テキスト形式の配布辞書)や旧バージョンについては現在ダウンロードサービスを行っておりません。利用を希望される方は[[下記の連絡先>#q40aa90a]]までメールでお問い合わせください。 **インストール [#t3d833a8] -Windowsパッケージの場合は,ダウンロードしたファイルを解凍し,インストーラ(INSTALL.EXE)を起動して指示に従ってください。インストール終了後,「近代茶まめ」のアイコンから起動してください。 -利用するには「MeCab 0.96」以降以降が必要です。あらかじめインストールしておくか、近代文語UniDicをインストールした後ですぐにインストールしてください。 --MeCabは次のページからダウンロードできます。&br; http://code.google.com/p/mecab/downloads/list **科研費報告書 [#x77a8536] 平成19(2007)〜平成20(2008)年度 科学研究費補助金 若手研究(B) 研究成果報告書 課題番号 19720110 -[[報告書PDF『近代文語文を対象とした形態素解析のための電子化辞書の作成とその活用』(2009) unidic-MLJ_report2009.pdf(10.5MB)>https://www.dropbox.com/s/14ph8gy7cg2l7wz/unidic-MLJ_report2009.pdf?dl=1]] **参考文献 [#wf64f0f0] (近代文語に限らない)UniDic全般に関する参考文献については、[[UniDicダウンロードサイトのこちらのページ>https://www.tokuteicorpus.jp/dist/modules/system/modules/menu/main.php?page_id=2598&op=change_page]]をご覧ください。 ***論文 [#j98c88ff] -[[小木曽 智信, 小町 守, 松本 裕治「歴史的日本語資料を対象とした形態素解析」,自然言語処理, 20(5), pp.727-748, 2013年12月>http://ci.nii.ac.jp/naid/40019911954]] ***学会発表 [#n02053df] -「近代文語文を対象とした形態素解析辞書の開発」小木曽智信・小椋秀樹・近藤明日子 『言語処理学会第14回年次大会発表論文集』 pp.225-228 2008年3月 -「近代文語文を対象とした形態素解析辞書・近代文語UniDic」 小木曽智信・小椋秀樹・近藤明日子 『日本語学会2008年度春季大会予稿集』 pp.211-218 2008年5月 ***資料(スライド) [#ace767f6] -日本語学会2008年度春季大会の会場で使用したスライドです。(情報はVer.0.7にもとづくものです。) --[[スライド(パワーポイント形式)>http://dl.dropbox.com/u/73297026/report/20080518_unidic-mlj_demo.ppt]] --[[スライド(PDF形式)>https://www.dropbox.com/s/f80r1gzvez9ia7q/20080518_unidic-mlj_demo.pdf?dl=1]] **連絡先 [#q40aa90a] 近代文語UniDicに関するお問い合わせは次のアドレスにお願いします。&br; 小木曽智信 &ref(mail.png); **更新履歴 [#z11ce83f] -2017/11/01 更新を停止。今後は[[こちらのページ>http://unidic.ninjal.ac.jp/]]をご覧ください。http://unidic.ninjal.ac.jp/ -2014/03/31 近代文語UniDic Ver.1.4 Windows版パッケージを公開。 -2012/12/06 近代文語UniDic Ver.1.3 Windows版パッケージを公開([[明六雑誌コーパス>http://www.ninjal.ac.jp/corpus_center/cmj/meiroku/]]の語彙を追加)。 -2012/05/02 近代文語UniDic Ver.1.2 Windows版パッケージを公開。 -2012/05/02 科研費報告書『近代文語文を対象とした形態素解析のための電子化辞書の作成とその活用』(2009)のPDFを公開。 -2009/08/14 近代文語UniDic Ver.1.1 Windows版パッケージ,バイナリ辞書(UTF-8版)を公開。 --品詞体系を現代語版UniDic 1.3.12と同期。 --MeCab版の辞書に仮名形やアクセント型などを出力するようにした。 -2009/03/31 近代文語UniDic Ver.1.0 Windows版パッケージ,バイナリ辞書(UTF-8版)を公開。 -2008/11/30 近代文語UniDic Ver.0.9 Windows版パッケージ,バイナリ辞書(UTF-8版)を公開。 -2008/08/01 近代文語UniDic Ver.0.8 Windows版パッケージ,バイナリ辞書(UTF-8版)を公開。 -2008/05/19 近代文語UniDic Ver.0.7a Windows版パッケージ(修正版)を公開。 --複数ファイルの解析に失敗するエラーに対応。 --ファイル末にEOFコードが付いているテキストファイルに対応。 -2008/04/11 近代文語UniDic Ver.0.7 Windows版パッケージを公開。 -2008/03/28 近代文語UniDic Ver.0.7 バイナリ辞書(UTF-8版)を公開。 **謝辞 [#a4c5d9e5] 近代文語UniDicの開発にあたっては次の研究補助金・助成金等を受けました。 -(辞書の見出し語整備)科学研究費補助金・若手B(平成19〜20年度・課題番号 19720110)&br; 「近代文語文を対象とした形態素解析のための電子化辞書の作成とその活用」小木曽智信&br; http://kaken.nii.ac.jp/d/p/19720110.en.html -(学習用コーパスの作成)第2回博報「ことばと文化・教育」研究助成(平成19年度)&br; 「近代日本語の文語文を対象とした形態素解析システムの構築と活用」小木曽智信・小椋秀樹・近藤明日子 -(見出し語の拡張)国立国語研究所・共同研究プロジェクト(平成21〜24年)&br;「近代語コーパス設計のための文献言語研究」(プロジェクトリーダー:田中牧郎) &br;http://www.ninjal.ac.jp/research/project/b/kindaigo/ なお、この辞書の元となった[[UniDic>http://download.unidic.org/]]は、文部科学省科学研究費補助金特定領域研究「代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備」(平成18〜22年度,領域代表者:国立国語研究所・前川喜久雄)ほかの助成を受けて開発が行われたものです。