KeyGraphとは
東京大学大学院工学系研究科の大澤助教授が開発したテキスト・データのコンテキストをノードとリンクによるネットワーク図で可視化するアルゴリズムです。
黒ノードは、テキスト・データ内の頻出頻度の高い上位語を意味します。黒ノードを結ぶリンクは、同一文章内で共起度の高い黒ノードの単語同士を結びます。この黒ノードとリンクの塊を「島」と呼び、テキスト・データにおける主要な主張や重要な事象を示しています。
一方、赤ノードはテキスト・データ内の頻度の少ない語を意味しています。上述の「島」と「島」を結ぶ赤ノードとリンクは、「橋」と呼ばれています。
この「橋」は、頻出頻度は低いものの黒ノードと同一文章内で共起する単語で、「島」と「島」との関係を意味しています。
詳細は、大澤助教授の論文を参照してください。http://www.gssm.otsuka.tsukuba.ac.jp/staff/osawa/KGsum/KGsummary.html
0 Comments:
Post a Comment
<< Home