RIES

Research Institute for Electronic Science, Hokkaido University

北海道大学
電子科学研究所

LAST UPDATE 2022/07/13

  • 研究者氏名
    Researcher Name

    田畑公次 Koji TABATA
    准教授 Associate Processor
  • 所属
    Professional Affiliation

    北海道大学電子科学研究所
    Research Institute for Electronic Science, Hokkaido University

    附属社会創造数学研究センター データ数理研究分野
    Research Center of Mathematics for Social Creativity, Molecule & Life Nonlinear Sciences Laboratory
  • 研究キーワード
    Research Keywords

    機械学習
    多腕バンディット
    純粋探索問題

    Machine learning
    Multi-armed bandit
    Pure exploration problem
研究テーマ
Research Subject
多腕バンディットアルゴリズムの開発と応用
Development and application of multi-armed bandit algorithm

研究の背景 Background

多腕バンディットとは、K個ある腕とよばれる選択肢の中から毎時刻一つ選択し、選ばれた腕に対応する未知の確率分布から報酬を受け取るのを交互に繰り返すモデルです。このような状況で例えば「ある時刻までの累積報酬の最大化」など所与の目標を達成するためには、知識利用と探索のトレードオフという問題を考える必要があります。このモデルは、インターネットの広告配信や計測の迅速化・効率化やゲームAIなど近年様々な応用されています。

Multi-armed bandit is a model in which the agent selects one of the K options called as arms in every time step and observes reward from chosen arm. To achieve a given goal, for example, "maximizing cumulative rewards up to a certain time", it is necessary to consider the trade-off between knowledge exploitation and exploration. This model has been applied in various area in recent years, such as online advertising, speeding up and efficiency of measurement, and game AI.

研究の目標 Outcome

現在、ラマン計測による診断の効率化を実現するための問題設定を数学の問題として定式化や、精度保証のある計測を実現するための多腕バンディットアルゴリズムの開発などを行っています。計測と情報が高度に融合したシステムの実現を目標にしています。

I am working on formulation of mathematical problem settings to improve diagnosis efficiency using Raman measurement, development of multi-armed bandit algorithm to realize measurement with guaranteed accuracy, etc. My target is to realize various systems in which measurement and information are highly integrated.

研究図Research Figure

Fig.1. finding a good candidate by multi armed bandit armed bandit.

Fig.2. Accelerated diagnosis by intensively measuring areas with high disease indicators.

文献 / Publications

Koji Tabata, Atsuyoshi Nakamura, Junya Honda and Tamiki Komatsuzaki, “A bad arm existence checking problem: How to utilize asymmetric problem structure?”, Machine Learning, 109(2), 327-372, 2020.

研究者HP