#author("2020-08-03T06:54:02+00:00","default:rd","rd") [[全文検索システム『ひまわり』]] &size(20){&color(red){本ページは現在構築中です};}; RIGHT:作成者:山口昌也 (国立国語研究所) RIGHT:2020-xx-xx #br * 1.概要 [#x0562e5e] このページでは,[[TED>https://www.ted.com/]]の字幕データを『ひまわり』で利用する方法について説明します。 * 2.準備 [#a003392e] //+ [[「毎日新聞データ集用変換パッケージ」>https://csd.ninjal.ac.jp/archives/Himawari/himawari_mainichi_20180822.zip]]をダウンロードしてください。 //+ 『ひまわり』を起動し,ダウンロードしたファイルを『ひまわり』にドラッグ&ドロップして下さい。なお,ファイルは展開(解凍)する必要はありません。 * 3.変換手順 [#j99c5630] ** 3.1 データの配置 [#vc95c8d5] ** 3.2 インポートの実行 [#na449f5c] //+ 『ひまわり』を起動して下さい。 //+ 3.1で作成したMainichiフォルダを『ひまわり』にドラッグ&ドロップして下さい。 //+ インポート設定用のウィンドウの「詳細オプション」をクリックすると,次のウィンドウが起動します。 //-- 「テキスト変換」オプションのメニューから「mainichi.htd」を選択して下さい。 //-- 「設定ファイル(テンプレート)」オプションのメニューから「mainichiConfig.xml」を選択して下さい。 //-- 「サブコーパスを作る」オプションにチェックを入れて下さい。 //#br //#ref(./import_mainichi.png,70%) //#br //+ 「インポート」ボタンを押すと,インポートの処理が開始します。「インポートが正常に終了しました」と出れば,成功です。 //+ 「毎日新聞データ集用変換パッケージ」のインストールをもう一度行なって下さい。これは,インポートの処理を行うと,「毎日新聞データ集用変換パッケージ」でインストールしたファイルの一部が削除されるためです。 * 4.利用方法 [#f41daeb2] ** 4.1 検索方法 [#r46250bd] //+『ひまわり』を起動し,[ファイル]→[コーパス選択]で,Mainichi(config_mainichi.xml) を読み込んでください。インポート直後はこの状態です。 //+ これで,インポートしたデータを検索できる状態になります。詳しい検索方法については,全文検索システム『ひまわり』の[[利用者マニュアル>全文検索システム『ひまわり』/利用者マニュアル]]を参照してください。 ** 4.2 検索結果 [#tdabd611] //|列名|内容|h //|タイトル|記事見出し| //|面種|記事の面種| //|年|記事を含む新聞の発行年| //|月|記事を含む新聞の発行月| //*アンケート [#u7dd9448] // よろしければ,アンケートにもお答えください。なお,このアンケートは,『ひまわり』をどのような方にお使いいただいているかを調べ,今後の研究・開発に活用させていただくためのものです。アンケート結果は,これらの目的以外には利用いたしません。 //#qa1(masaya,masaya,[himawari-mainichi_20180822],所属:大学・高専等/小中高・専門学校等/研究機関/企業/個人/その他,身分:教職員/研究員/学生/その他,専門分野:日本語(国語)学/英語学/言語学/言語教育/自然言語処理・人工知能/その他(人文社会系)/その他(理工系),母国語:日本語/日本語以外,年齢:10代未満/10代/20代/30代/40代/50代/60代/70代以上,使用OS:Windows/Mac/Linux/その他,コンピュータ使用歴:1年未満/1年以上3年未満/3年以上,:TEXTAREA:ご意見・ご感想:3:81)