[PukiWiki]

UniDic/中古和文UniDic

Top/UniDic/中古和文UniDic

UniDic

  • 2022/04/01 このページは更新は終了しています。UniDicの情報はこちらのページをご覧ください。 http://clrd.ninjal.ac.jp/unidic
  • 2012/05/02 科研費報告書『和文系資料を対象とした形態素解析辞書の開発』(2012),『中古和文UniDic 短単位規程集』(2012)のPDFを公開しました。

形態素解析辞書 : 中古和文UniDic†

  • UniDicの情報をまとめた新しいサイトがオープンしました。このページの内容は古い情報です。今後はこちらのページをご覧ください。
  • →https://clrd.ninjal.ac.jp/unidic/

  • 形態素解析辞書 : 中古和文UniDic
    • 概要
      • 和文茶まめ(Windows版)画面
      • 解析精度比較
    • 利用条件
      • 中古和文UniDic 利用条件
    • ダウンロード
      • 中古和文UniDicのダウンロード
    • インストール
    • 科研費報告書
    • 参考文献
    • 連絡先
    • 更新履歴
    • 謝辞
↑

概要†

  • 中古和文UniDicは、UniDicをもとにして中古の和文系資料(いわゆる古典,古文)を解析できるようにした形態素解析辞書です。(現代語版のUniDicはこちら)
  • 主として校訂済みの中古和文(仮名文学作品)を対象としています。他の種類のテキストでは必ずしも良い解析結果が得られません。
  • MeCab版を公開しています(ChaSen版は公開していません)。
↑

和文茶まめ(Windows版)画面†

  • 手軽に解析を行うためのツール
    wabun_chamame05.png
↑

解析精度比較†

  • 中古和文テキストの解析精度を他のUniDicと比較しました。
  • テストデータは約2万5千語を文単位でランダムサンプリングしたものです(学習に利用せず,ただし中古和文UniDicにとっての未知語なし)。
    wabun_compare05.png
↑

利用条件†

(現代語版UniDic 1.3.12と同等の内容です)

↑

中古和文UniDic 利用条件†

  1. 中古和文UniDic の著作権は,小木曽智信,小椋秀樹,田中牧郎,近藤明日子,須永哲矢 および The UniDic consortium(代表:伝康晴)が保持する。
  2. 中古和文UniDic を複製又は改変することは,個人的な利用に限り認める。
  3. 中古和文UniDic 及びこれを改変したものを再配布してはならない。
  4. 中古和文UniDic を利用して行った研究等の成果を公表する場合は,中古和文UniDic を利用したことを明記すること。
  5. 営利を目的として,中古和文UniDic を利用する場合は,事前に著作権者と協議すること。
  6. 中古和文UniDic を利用することによって,直接的・間接的に生じたいかなる損害についても,著作権者は賠償する責任を負わない。
  7. 本文書に定めのない事項については,著作権者と協議すること。
↑

ダウンロード†

↑

中古和文UniDicのダウンロード†

  • 本ページからのダウンロードサービスは終了しました。今後はこちらのページをご覧ください。http://unidic.ninjal.ac.jp/

恐れ入りますが,次のアンケートにお答えください。アンケート結果を送信するとダウンロードページに移動します。
なお,このアンケートは『中古和文UniDic』をどのような方にお使いいただいているかを調べるものです。お送りいただいた情報は,今後の研究・開発に利用させていただきます。

↑

インストール†

  • Windowsパッケージの場合は,ダウンロードしたファイルを解凍し,インストーラ(INSTALL.EXE)を起動して指示に従ってください。インストール終了後,「和文茶まめ」のアイコンから起動してください。
  • 利用するには「MeCab 0.96」以降が必要です。あらかじめインストールしておくか、中古和文UniDicをインストールした後ですぐにインストールしてください。
    • MeCabは次のページからダウンロードできます。
      http://code.google.com/p/mecab/downloads/list
↑

科研費報告書†

平成21(2009)−平成23(2011)年度科学研究費補助金基盤研究(C)「和文系資料を対象とした形態素解析辞書の開発」 課題番号21520492

  • 報告書PDF『和文系資料を対象とした形態素解析辞書の開発』(2012) unidic-EMJ_report2012.pdf(15.5MB)
  • 規程集PDF『中古和文UniDic 短単位規程集』(2012) unidic-EMJ_rulebook2012.pdf(1.6MB) (※内容が古くなっています)
↑

参考文献†

(中古和文UniDicに限らない)UniDic全般に関する参考文献については、UniDicダウンロードサイトのこちらのページをご覧ください。

  • 小木曽智信・小椋秀樹・田中牧郎・近藤明日子・伝康晴「中古和文を対象とした形態素解析辞書の開発」『情報処理学会研究報告 人文科学とコンピュータ』Vol.2010-CH-85(No.4) pp.1-8 2010年2月
    →情報処理学会 電子図書館
  • Toshinobu Ogiso, Mamoru Komachi, Yasuharu Den and Yuji Matsumoto. UniDic for Early Middle Japanese: a Dictionary for Morphological Analysis of Classical Japanese. In Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC): Posters, pp.911-915. Istanbul, Turkey, May 2012. http://www.lrec-conf.org/proceedings/lrec2012/pdf/906_Paper.pdf
  • 小木曽智信「中古仮名文学作品の形態素解析」『日本語の研究』第9巻4号(通巻255号) pp.49-62,2013年10月 →CiNii
↑

連絡先†

中古和文UniDicに関するお問い合わせは次のアドレスにお願いします。
小木曽智信 mail.png

↑

更新履歴†

  • 2017/11/01  更新を停止。今後はこちらのページをご覧ください。http://unidic.ninjal.ac.jp/
  • 2014/03/31 中古和文UniDic Ver.1.4 Windows版パッケージを公開。
  • 2012/12/06 中古和文UniDic Ver.1.3 Windows版パッケージを公開。
  • 2012/05/02 中古和文UniDic Ver.1.2 Windows版パッケージを公開。
  • 2012/05/02 科研費報告書『和文系資料を対象とした形態素解析辞書の開発』(2012),『中古和文UniDic 短単位規程集』(2012)のPDFを公開。
  • 2010/10/21 中古和文UniDic Ver.0.5 Windows版パッケージ及びMeCab用バイナリ辞書を公開。
↑

謝辞†

中古和文UniDicの開発にあたっては次の研究補助金・助成金等を受けました。

  • 日本学術振興会科学研究費補助金(基盤研究(C))「和文系資料を対象とした形態素解析辞書の開発」(平成21〜23年度,代表者:小木曽智信)
  • 国立国語研究所・共同研究プロジェクト(平成22〜25年)
    「統計と機械学習による日本語史研究」(プロジェクトリーダー:小木曽智信)
    http://www.ninjal.ac.jp/research/project/c/statisticsja/

なお、この辞書の元となったUniDicは、文部科学省科学研究費補助金特定領域研究「代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備」(平成18〜22年度,領域代表者:国立国語研究所・前川喜久雄)ほかの助成を受けて開発が行われたものです。

論文などで引用する際の
成果物の短縮URL

 

メニュー

  • コーパス
    • 『日本語話し言葉コーパス』
    • 『太陽コーパス』
    • 『近代女性雑誌コーパス』
       
  • 辞書関連
    • 形態素解析辞書『UniDic』
    • 語種辞書『かたりぐさ』
    • 『表記統合辞書』
    • 『分類語彙表増補改訂版』
       
  • 用例データベース
    • 複合動詞
    • サ変動詞
    • 形容詞
       
  • ソフトウェア
    • 全文検索システム『ひまわり』
    • 観察支援ツール FishWatchr
    • 観察支援ツール FishWatchr
      Mini
    • 作文支援システム TEachOtherS
    • 『ひまわり』支援ツール
    • 『たんぽぽ』,『プリズム』
       
  • 成果物の短縮URL
  • 講習会
     
    最新の10件
    2025-05-15
    • 観察支援ツール FishWatchr
    2025-04-08
    • 新着情報の履歴
    • 言語データベースとソフトウェア
    • 全文検索システム『ひまわり』/ダウンロード/UniDicパッケージ
    2025-04-02
    • 全文検索システム『ひまわり』
    • 全文検索システム『ひまわり』/ダウンロード/『青空文庫』パッケージ
    • 全文検索システム『ひまわり』/ダウンロード/『青空文庫』パッケージ/履歴
    2025-03-28
    • TEachOtherS
    2024-11-21
    • 成果物の短縮URL
    2024-06-11
    • 観察支援ツール FishWatchr/既知の問題

total:26752
today:2
yesterday:6

トップ   編集 凍結 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2022-10-11 (火) 16:01:48