Tuesday, August 04, 2009

データ結晶化のアルゴリズム

データ結晶化のアルゴリズムは、下記のステップで構成されている。

1.バスケットデータの全てのノードペアのJaccrad係数を計算する。
2.Jaccard係数の大きいノードペアが集まるようノードをクラスタに分類する。

3.クラスタに分類する際の手法として、K-Medoids法を利用する。
4.ダミーノードを各バスケットデータに挿入する。
5.Jaacard係数の高いダミーノードを選択して表示し、他は削除する。
  クラスターのノードとダミーノードとのの共起性は、下記の式で計算する。


ダミーノードは、クラスター内のJaccard係数の最も高いノードとリンクされることになる。
今後、Dummy Nodeとリンクするクラスターのノードのデータを参照に、各々の関係性を明示したうえでクラスター間の関係を考察するというように精度を上げて、新たなシナリオを考察したいと思います。
ただし、精度を上げた解釈により、ユニークな新たなシナリオが生れるかどうかは、新たな研究課題になると思います。この課題は、別の実験を組み立ててそのプロセスを考察する必要があるでしょう。

0 Comments:

Post a Comment

<< Home