研究コンセプト

■学習数理情報学

数理第6研究室は学習数理情報学を専門とする研究室です。

学習数理情報学とは、大量データから計算機がいかに有用な知識を獲得できるか?といった問に対して、数学モデルを中心にアプローチする学問です。これは機械学習とも呼ばれています。

本研究室の学習数理情報学は機械学習の理論的側面である情報論的学習理論と実践的側面であるデータマイニングの両輪から成ります。 

concept

■情報論的学習理論

「機械はどこまで学習できるか?」この問いに対して情報理論・統計学からアプローチしています。特に、MDL原理(Minimum Description Length Principle; 記述長最小原理)と呼ばれる情報理論の基本原理を軸にして、モデル選択、分散協調学習、オンライン学習、変化検知、異常検知など幅広い学習問題に有効な機械学習アルゴリズムを統一的に導き出しています。
 

■データマイニング

  ・データマイニング基礎
大量データからの知識発見技術(異常検知、変化検知、ネットワークマイニング、など)を研究しています。特に、データに潜む隠れた構造を抽出し、その変化を解析する、新しい学問コンセプトとして「潜在的ダイナミクス(Latent Dynamics )」を提唱しています。潜在的ダイナミクスは、電子情報通信学会誌2014年5月号(Vol97, No.5)の特集「データを読み解く技術」の1テーマとして特集されています。
 
  ・データマイニング応用
現実の複雑なデータに上記技術を応用して効果を生み出ための適用技術の研究を行っています。特に、これらの成果をセキュリティ、マーケティング、ソーシャルネットワーク解析、教育データ解析、医療応用などに活用して効果を生んでいます。その際、各種業界のエキスパート一緒に現実のデータの分析を行い、どうしたら知識は価値をもつのかを研究しています。

 

LD

 

 

LD2

■ディープナレッジの発見と価値化

上記、本研究室の情報論的学習理論とデータマイニングの技術を集結させて、2013年よりJST-CRESTの「ビッグデータ基盤」の中で「複雑データからのディープナレッジの発見と価値化」というテーマの研究に取り組んでいます。ディープナレッジとは、データの表面からは分からない、潜在空間の奥底に潜む深い知識のことです。これを抽出し、価値に変えるための研究を行っています。

昨今のビッグデータブームでは、データの大量性のみが注目されていますが、ビッグデータの扱いを困難にしているのは、その動的特性(velocity)や多様性(variety)や高次元性など、データの複雑性にあると考えられます。そこで、複雑なデータには、その背景に深い構造(ディープナレッジ)があると考え、その姿を読み解くことを目指します。つまり、ディープナレッジを通じてデータの全体像を俯瞰し、将来のデータの動きを的確に予測することを目的として研究を行います。このようなディープナレッジの発見と価値化について、潜在的ダイナミクス、関係データ予測、ネットワーク理論、を含む最先端データ技術を総動員して取り組んでいます。より詳しくは、CRESTについてのページで説明していきます。

ディープナレッジについては、IBM Provision誌(No.78, 2013)のインタビュー記事に詳しく述べております。

 

詳細はこちら

 

 

 

 

 

 

 

 

PageTop