Tuesday, March 21, 2006

時系列共起パターン解析エンジン「KIZASHI」とは?

K氏より、最近の新しいデータ入手方法としてKIZASHIの紹介がありました。
「時系列共起パターン解析エンジン」を株式会社シーエーシー 技術研究センターが開発しました。
http://kizasi.jp/

インターネット上のブログの時間情報を持つデータを収集し、言語処理、解析し、ある時間におけるブログで話題となっている共起頻度の高い言葉の順に順位を発表します。

特徴として、準実時間のインデクシングクローリングからインデクシングまでの処理をパイプライン化し、時間とともに増加するテキストデータを準実時間で解析できます。その結果、話題の傾向を遅延なく捉えることができます。
概念辞書(オントロジー)の内蔵語の分類属性を利用して、ジャンルによるランキングや関連性検索を可能としています。確率的アルゴリズムを使用し、同形異義語の判定も可能です。

この検索技術により、現在社会で話題となっている単語を明示し、今後の社会のトレンドを読んだり、マーケティングなどに役立てるのではないかとの提案です。

この手法は、累積データの解析ではなく、特定時間のデータを暫時時系列で解析していくので、話題の変化が時系列で解析する事ができます。
この技術を応用して、社会全般ではなく特定分野に絞り込んで時系列で話題となっている言葉を解析する事により、製品分野を絞り込んだ要望を解析することが可能になります。
掲示板より、ブログのほうが内面的な欲望や需要、感想などを自己表現しており、より本質的な需要を捉えられる可能性があり、時系列でとらえられることはマーケティング分析には非常に重要なものと思えます。
我々としては、このデータをKeyGraphで解析し、更に共起頻度だけでなく、高頻度の言語間を結ぶ稀な言語を時系列で解析することにより、より新たな発見が生まれることを期待したいと思います。

2 Comments:

At 3:22 PM, January 17, 2007, Anonymous Anonymous said...

こんいちは、堀江さん

時系列共起パターン解析でぐぐったら
ここにたどり着きました。
この内容の更なるディープなところを
調べたいのですが、論文とかご紹介
することは可能でしょうか。

 
At 1:51 PM, March 10, 2007, Blogger kenken said...

村上さん

お久しぶりです。
論文の紹介は可能です。
大澤先生と前野さんが開発されたData CrystallizationとHuma-Interactive Annealingのアルゴリズムとプロセスが私の研究のベースとなっていますので、お二人の論文を参照してみてください。
私の論文は、JSSSE 07年3月号の掲載されています。

 

Post a Comment

<< Home