[PukiWiki]

全文検索システム『ひまわり』/ダウンロード/『ひまわり』ver.1.6/リリースノート/実行例20170120b の履歴の現在との差分(No.4)


  • 履歴一覧
  • 差分 を表示
  • ソース を表示
  • 履歴 を表示
  • 全文検索システム『ひまわり』/ダウンロード/『ひまわり』ver.1.6/リリースノート/実行例20170120b へ行く。
    • 1 (2017-03-13 (月) 15:42:31)
    • 2 (2017-03-15 (水) 16:57:22)
    • 3 (2017-03-15 (水) 16:58:02)
    • 4 (2017-03-15 (水) 17:01:19)
    • 5 (2017-03-15 (水) 17:02:09)
    • 6 (2017-03-15 (水) 17:02:31)
    • 7 (2017-03-15 (水) 17:02:48)
    • 8 (2017-03-15 (水) 17:05:18)
    • 9 (2017-03-15 (水) 17:05:29)
    • 10 (2017-03-15 (水) 17:15:59)
    • 11 (2017-03-15 (水) 17:17:45)
    • 12 (2017-03-15 (水) 17:19:50)
    • 13 (2017-03-15 (水) 18:12:37)
    • 14 (2017-03-15 (水) 18:14:36)
    • 15 (2017-03-15 (水) 18:14:51)
    • 16 (2017-03-15 (水) 18:17:20)
    • 17 (2017-03-15 (水) 18:17:46)
    • 18 (2017-03-15 (水) 18:18:50)

  • 追加された行はこの色です。
  • 削除された行はこの色です。
[[全文検索システム『ひまわり』/ダウンロード/『ひまわり』ver.1.6/リリースノート]]

* 合併 [#pd71f527]
* 結合 [#pd71f527]
 複数の一覧・集計結果を結合する機能です。次の例は,青空文庫サンプル(config_aozora_sample.sd.xml)を使って,作品ごとの「この」の調整頻度を作成するまでの流れです。

+ 基本形で「この」を検索し,検索結果から「キー」「タイトル」列で頻度を集計します。集計には,「キー」「タイトル」列のセルを一つづつ選択して,右クリック⇒[統計]を実行して下さい。
#br
|&ref(./join01.png,60%);|
#br
+ 結果は次のようになります(表1)。
#br
|&ref(./join03.png,80%);|
#br
+ 次に一覧機能([ツール]⇒[一覧]⇒[ユーザ入力])で,作品ごとの総単語数を求めます(表2)。
#br
|&ref(./join02.png,80%);|
#br
+ 表1に表2の頻度列(総単語数)を結合します。結合にはキーとなる列と結合したい列を指定します。ここでは,キーとして「タイトル」を使います。指定には,表2の「タイトル」「頻度」列のどれかを選択して,[編集]⇒[コピー(列名を含む)]を実行します。
#br
|&ref(./join04.png,80%);|
#br
+最後に,結合先の表でキーの列(「タイトル」列のどれか)を指定したうえで,[編集]⇒[結合]を実行します。結果は次のようになります。
#br
|&ref(./join05.png,80%);|
#br


* 合算 [#c9791dc8]
 文字数などの集計結果をさらに合算することができます。次の例は,太陽コーパスサンプルの「引用」タグの使って,話者ごとの発話文字数の合計を求めている例です。

+ 次の一覧結果は,一覧機能で,「引用」タグの話者,種別属性を表示すると同時に,引用タグでマークアップされている文字列の長さを集計したものです。
#br
|&ref(./accumulation01.png,80%);|
#br
+ 「引用%文字列」欄を右クリックし,[合算]を実行します。
#br
|&ref(./accumulation02.png,80%);|
#br
+ 結果は,次のようになります。元の一覧結果の頻度情報を考慮し,文字数と積を取ったうえで合算しています。例えば,元の一覧結果の2行目の文字数は13,頻度2になっていますが,合算する際は26が加算されます。なお,結果の頻度欄はすべて1になります。
#br
|&ref(./accumulation03.png,80%);|
#br


* 置換 [#nb1f6eb5]
 検索結果や一覧結果を置換する機能です。以下の例は,国会会議録パッケージで開催年月日を開催年に置換している例です。
 検索結果や一覧結果を置換する機能です。次の例は,国会会議録パッケージで開催年月日を開催年に置換している例です。

+「開催日」列のタイトルを右クリックし,[置換]を実行します。
|&ref(./replace01.png)|
#br
|&ref(./replace01.png,80%);|
#br
+正規表現で年と日の部分を削除します。正規表現は,「-.*」を指定しています。
|&ref(./replace02.png)|
#br
|&ref(./replace02.png);|
#br
+実行結果は,次のように,年と日の部分が削除されます。
#br
|&ref(./replace03.png,80%);|
#br


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS