#author("2022-04-12T16:31:22+09:00","default:rd","rd") #author("2022-04-12T17:41:32+09:00","default:rd","rd") [[全文検索システム『ひまわり』/『日本語日常会話コーパス』]] #br &color(red){&size(20){本ページは,現在構築中です。};}; #br #br * CEJCデータ配布サイトの『ひまわり』関連ファイルの利用方法 [#pf37758f] ** 1.概要 [#td3a88b1] [[CEJCデータ配布サイト>https://cejc-data.ninjal.ac.jp/]]で配布されている『ひまわり』関連ファイル(tool.zip)の利用方法を説明します。 [[CEJCデータ配布サイト>https://cejc-data.ninjal.ac.jp/]]で,複製サービス(実費負担)として提供されている『ひまわり』関連ファイル(tool.zip)の利用方法を説明します。 tool.zipは,CEJC配布ハードディスクの tool フォルダを zip 形式で圧縮したものです。CEJCデータ配布サイトで配布されている,動画データと組み合わせて利用することにより,配布ハードディスクと同じように,『ひまわり』で転記テキストの検索と動画データの再生を行うことができます。 このページでは,次の2通りの利用方法について,説明します。 - 転記テキストの検索のみを行う場合(動画データを利用しない場合) - 転記テキストの検索,動画データの閲覧を行う場合(配布ハードディスクでの利用と同等) ** 2.利用方法 [#ld20a14f] *** 2.1 転記テキストの検索のみを行う場合(動画データを利用しない場合) [#i20fed6c] - 転記テキストの検索のみを行う場合は,tool.zip をデスクトップなど,使いやすい場所に展開(解凍)するだけです。 - 展開後は,『ひまわり』用CEJCパッケージの[[マニュアル3.2節>../#pe635ec0]]にしたがい,インストールを続行してください。 *** 2.2 転記テキストの検索,動画データの閲覧を行う場合 [#t935db9d] 転記テキストの検索に加え,動画データの閲覧を行う場合は,CEJCデータ配布サイトで配布されている各種のデータをダウンロードし,配布ディスクと同じ構造でフォルダを構成する必要があります。手順は,以下のとおりです。 + 配布サイトの [[有償版:転記・アノテーション・ツール・メタ情報>https://cejc-data.ninjal.ac.jp/course/view.php?id=8]]から,次のデータをダウンロードしてください。 -- tool.zip -- data.zip + CEJC用のフォルダ(ここでは,HD_CEJCとします)を作って,ダウンロードしたファイルを展開します。展開後のフォルダ構造は,次のように,配布ディスクと同じ構造になるようにしてください。 HD_CEJC +-- data | |-- C001 | |-- C002 | : +-- tool |-- FW_DATA |-- Himawari |-- README.txt |-- himawari_cejc_202203.zip + 動画ファイルを配布サイトの [[有償版:映像音声データ>https://cejc-data.ninjal.ac.jp/course/view.php?id=7]]からダウンロードしてください。 -- [[CEJCのマニュアル>https://www2.ninjal.ac.jp/conversation/cejc/media.html]]のとおり,動画ファイルは複数の種類がありますが,「合成した映像」と呼ばれる,「会話ID_MIX.mp4」の形式の動画ファイルを使用してください。 -- なお,ダウンロードの際は,配布サーバのネットワーク負荷が高くならないよう,複数ファイル,長期間のダウンロードなどはお控えください。 + ダウンロードした動画ファイルを data フォルダの適切な場所に配置してください。例えば,会話IDが C001_001 の動画ファイル C001_001_MIX.mp4 の場合は,次の場所になります。 HD_CEJC +-- data | |-- C001 | |-- C001_001 | |-- C001_001_MIX.mp4 + 動画ファイルの配置が終わったら,『ひまわり』用CEJCパッケージの[[マニュアル3.2節>../#pe635ec0]]にしたがい,インストールを続行してください。 // 本パッケージを利用するには,配布ディスクと同じフォルダ構造でCECJのデータを配置する必要があるため,その