Monday, May 29, 2006

特許の予備実験開始







韓国、台湾、中国、イスラエル、イタリアとこの数週間海外出張が多すぎて、全く研究に手をつけることが出来なかった。
しかし、8月1日締め切りのKES ジャーナルや10月中国北京で開催されるCODATAの研究発表に備えて、予備実験に着手した。
被験者5名に、マーキング装置関連特許6件のデータをKeyGraphにて処理し、黒ノード、黒リンク、赤ノード数を9段階に増加させながら、9枚のシナリオマップを提示し、各々のシナリオマップから解釈できるシナリオを創出してもらった。
次に、M氏が開発した、既存データにダミーデータを取り込み、データにはないがクラスター間に関連性のありそうなダミーデータ(謎)を表示できるアルゴリズム”Anneachan”を使ってPolarisにてシナリオマップを作成し、5名の被験者個々に提示し、新たなシナリオを創発してもらった。

結果:
  1. 最初の9枚のシナリオマップについては、被験者全員が解釈する事が出来た。 被験者よりシナリオの内容はばらばらであったが、ノード数増えるに従い詳細なシナリオを作成することが出来た。
  2. ダーミーノードに現れたシナリオマップについては、被験者全員が4つのクラスターを解釈するシナリオを創出することは出来た。また、謎であるダミーノードに適切と思われる単語は想起できたが、新たなシナリオを創発するには至らなかった。
考察:
  1. ダミーノードの現れたシナリオマップは、5つの大きなクラスターに分類された。観察者としては、その5つの分類が個別特許技術を示している事を期待したが、その通りりかどうかはまだ検証できていない。 少なくとも特許は目的と手法が記述されており、その共通された内容がクラスターになっているはずである。仮に、そうでない場合は、特定特許技術に関わる目的と手法がクラスター内で構造化されるために、データ前処理の方法を考える必要がありそうである。
  2. 個々のクラスター内部の黒ノードの単語は間引いた結果を示しているため、非常に頻出頻度の高い言語がリンク関係を示さず羅列されて表示されているため、共起グラフ図のような状態で、クラスター内の赤ノードのような高頻出頻度の言語と言語を結ぶ関係性を示す言語が現れず、解釈しにくい。また、クラスター内でのチャンス発見は不可能である。クラスターを明確に解釈するためには、クラスター内の高頻出頻度の言葉の順番及び関係性を示す必要がある。
  3. 単語を間引く必要があるが、間引き方を高頻出頻度言語だけでは、十分な解釈は得られない。クラスター内部でノード頻出頻度の低い単語から段階的に高い頻度の言語に移動し、解釈を深めながら、最終の形にしなければクラスター内部の解釈は困難である。

0 Comments:

Post a Comment

<< Home