CRESTについて

CREST研究について

本研究室は、JST-CREST「ビッグデータ統合利活用のための次世代基盤技術の創出・体系化」(研究統括 喜連川優)の1テーマとして、 「複雑データからのディープナレッジ発見と価値化」 (研究代表 山西健司)に取り組んでいます。

本研究の目的

本研究では、多様な情報が連結した情報ネットワークに内在する深い知識(ディープナレッジ)の発見とその価値化を目的にします。従来のBigData研究はデータの大量性に関心が集中してきました。しかし、現実のデータが複雑な関係を持つ膨大な項目から構成され、医療、犯罪、政治、経済などに直に結びつくにつれ、その背後の対象知識を如何に深読みするか、という問題の追及が極めて重要になってきています。本研究はそのような質の側面をより重要視して、BigData研究の日本独自の方向性を生み出すものです(図1)。

 DK0

現在、注目すべきBigDataの多くは、一様な性質をもったSmallDataが混在している状況であり、個別にみると大数の法則も中心極限定理も適用できない代わりに、広大なネットワークの中で多様なデータとつながりをもっています。しかもそれは(A)次元や、ネットワーク規模の意味において空間的に広大かつヘテロであり(variety)、(B)多くの変化を伴っているという意味で時間的に多様です(velocity)。

BigDataの問題の本質は、そうしたデータの複雑さにあり、そのような巨大なデータのプールから、如何に個々のデータを関連させ、横串を刺しながら、データの背後に眠る潜在世界の全体像をあぶり出し、その時間的空間的な発展を予測制御するかといった点が大きな課題であると考えます。我々はそのような多様な時空間に潜在する知識を「ディープナレッジ(Deep Knowledge)」と呼び、これを発見し、価値(value)を与えるための普遍的な数理的方法論を生み出すことを目的とします。

我々はディープナレッジを、具体的には、情報ネットワークに存在する潜在的な関係やその構造変化(図2)、テンポラル・ネットワーク(図3)、行動モデル等の数学的対象として捉えます。本研究は学習理論、情報理論、統計理論、計算機理論、ネットワーク理論、データマイニング、認知モデルを総動員して、ディープナレッジを発見し、これに価値を与えるための総合的な科学基盤を構築し、新しい「知識科学」とも呼べる分野を開拓するものです。

 DK

 example2

本研究チームの構成

山西研究代表のチームは以下の4つのグループから成り立ちます。

 

●山西グループ(研究代表: 山西健司(東京大学))

テーマ:「ディープナレッジのモデル論、推定論の構築」

 

●増田グループ(主たる共同研究者: 増田直紀 (Bristol 大))

テーマ:「ディープナレッジとしてのテンポラル・ネットワークの解析理論の構築」

 

●IBMグループ(主たる共同研究者: 恐神貴行 (IBM東京基礎研))

テーマ:「ディープナレッジを価値につなげるための意思決定最適化技術の開発」

 

●大澤グループ(主たる共同研究者: 大澤幸生 (東京大学))

テーマ:「ディープナレッジの利用価値を創造するデータ市場の構築手法の開発」

 

全体像としては、ネットワークデータの多様性(variety)及び変化(velocity)に着目したディープナレッジ発見理論基盤の構築を山西グループ、増田グループが担当し、IBMグループと大澤グループは、多様性(variety)から価値(value)に力点を置いて、ディープナレッジの活用基盤に関する研究を担当します(図4)。

 system

山西グループでは、ディープナレッジを潜在変数モデルとして捉え、そのモデル論と推定論を推進します。増田グループでは、ディープナレッジとしてテンポラル・ネットワーク(時間情報を伴うネットワーク)に注目し、その理論と実証を進めます。IBMグループではディープナレッジを行動データモデルとして捉え、これに基づく意思決定最適化を研究します。大澤グループはディープナレッジの利用価値を創造するデータ市場の構築手法を研究します。

 

PageTop