この例文でテストしてみます。という文が入力されたテキストファイルが,調査対象だとします。
この この コノ 連体詞 例文 例文 レイブン 名詞-一般 で で デ 助詞-格助詞-一般 テスト テスト テスト 名詞-サ変接続 し する シ 動詞-自立 サ変・スル 連用形 て て テ 助詞-接続助詞 み みる ミ 動詞-非自立 一段 連用形 ます ます マス 助動詞 特殊・マス 基本形 。 。 。 記号-句点 EOS
perl add_gosyu.pl katarigusa.txt test.txt.cha > gosyu_test.txtのうち,「test.txt.cha」の部分が入力となるファイル名,「gosyu_test.txt」の部分が出力となるファイル名です。これらの箇所を,適宜書き換えてご利用ください(※ただし,ファイル名は半角英数字にしてください)。
この この コノ 連体詞 和 コノ 例文 例文 レイブン 名詞-一般 漢 レイブン で で デ 助詞-格助詞-一般 和 デ テスト テスト テスト 名詞-サ変接続 外 テスト し する シ 動詞-自立 サ変・スル 連用形 和 スル て て テ 助詞-接続助詞 和 テ み みる ミ 動詞-非自立 一段 連用形 和 ミル ます ます マス 助動詞 特殊・マス 基本形 和 マス 。 。 。 記号-句点 EOS
$FN_CHASEN_HYOUKI = 1; $FN_CHASEN_YOMI = 2;を
$FN_CHASEN_HYOUKI = 2; $FN_CHASEN_YOMI = 1;のように書き換えてください。
文 文 ブン 名詞-一般 漢/和 {ブン/フミ}このため,「語種を判定した読み」の欄として,『かたりぐさ』が語種情報の根拠としている IPADIC の「読み」欄を,一番右の列に出力するようにしてあります。
最終更新日: 2005-09-06, 作成日: 2005-03-24