研究タイトル

メーカー企業の受注データに基づく意味論的類似解析と応用

研究コンセプト

現在、研究分野だけではなく、民間企業においても、大量な非・半構造化電子データが生成されています。 多くの人は、これらのデータを予想されないニーズとマッチングがきれば、問題解決やリスク評価など新たな領域に利便が得られると言いますが、自然言語などで書かれている非構造化電子データの「シーズ」 を他の関係のない「ニーズ」と正確にマッチングするため、そのシーズとニーズの「意味」の解析を可能にしなければなりません。

近年研究されている非構造化電子データの処理技術のほとんどは、下記の4種類に分類されます。

  • 自然言語処理(NLP)の方法: 情報抽出(IR)、固有表現認識(NER)など
  • 統計学的モデルの方法: クラスター化、機械学習、グーグルのPageRankなど
  • 意味論的解析:フォークソノミー等軽量オントロジー、セット理論による推論など
  • 知識の統合化: 連想検索、オントロジー・アラインメント、文献ベースの発見など

しかし、これらの手法では、意味論的な類似度、即ち「what I mean, not what I say」について、自然言語など、人間理解の世界におけるコミュニケーションの情報形式からコンピュータが意味論的に処理できる セマンティックスの抽出の能力限界に制限されています。

そこで、本研究の提案手法では、人間が自らの知識を人間理解の世界に共有する際、その同じ人間が能動的にコンピュータの理解可能な記述を作成し、それに基づいてコンピュータが意味論的に類似度を計算します。

研究に使われているキーな技術は下記のものがあります。

  • 正式的な知識表現言語として機能できる重量オントロジー(DLオントロジーなど)
  • ルールや理論に基づく意味論的な推論をするプログラム
  • 人間が作成する「コンピュータ理解可能な記述」の生成・管理システム(EKOSS)
  • 記述を作成するユーザへのフィードバックを提供する為、自然言語生成の応用

「メーカー企業の受注データに基づく意味論的類似解析と応用」という研究テーマでは、主に下記の二つの研究課題について研究を進めています。

  1. 企業者が日常業務の中で「コンピュータ理解可能な記述」を作成する場面の設計と提供
  2. 受注データなどの情報に用いる意味論的類似解析の応用シナリオの設計と開発

上記2つの研究課題で考えられる応用シナリオは下記のシナリオです。

  • 受注間の類似度を計り、新顧客と最も類似する受注や購入歴を持つ過去の顧客を検索する
  • 類似度を用いて、受注をクラスタ化し、購入歴に基づくマーケットセグメンテーションや顧客の主要な属性を解明する
  • グラフマイニングを用いて、頻繁に現れる買上科目のパターンを抽出し、よく一緒に購入する品目の組み合わせの標準化をする

研究内容

research_detail4-1
research_detail4-2

一覧へ戻る