HOME > 研究プロジェクト

研究プロジェクト

・Deep Learning

・ドメイン適応

深層学習は、画像や音声など様々な分野で高精度な認識を達成しています。しかし、その真価が発揮されるのは 教師ラベルが十分に得られる領域(ドメイン)に限るというのが現状です。例えば、監視カメラの映像から人の 検出を学習させたいとします。ここでは、何らかの要因で、収集できるデータは明るい環境下で撮影された映像 のみであり、本当に人の検出を行いたい暗い環境下の映像が十分に得られない状況を想定しましょう。教師あり 学習により、明るい環境下の映像に対しては高精度な認識が行える一方、学習データにはない暗い環境下の映像 に対しては認識精度が低下するという問題が発生します。ドメイン適応では、こういったドメインの違いを解消 することを目的とし、前者をソースドメイン、後者をターゲットドメインとし、タスクを行うための知識や概念 の転移を目指します。本研究室では、ドメイン適応を実現するために、異なるドメインの特徴分布を一致させる 手法について研究しています。潜在空間においてずれてしまっている分布を一致させることで、教師ラベルがな いターゲットドメインにおいても高精度な認識を可能にします。

ドメイン適応※1

・地図セグメンテーション・地図交差点抽出

深層学習を用いて、任意のイラスト地図に対し、道路構造を抽出する手法を研究しています。本研究は、位置情報と連動させたイラスト地図のwebサービスを対象としています。イラスト地図は自由な色調で描かれ、そのスタイルは様々です。そんなイラスト地図とリアルな世界との位置情報を連動させるためには、それらがどの地域のどの地点のものであるかを同定する必要があります。その実現のため、本研究では道路構造と交差点情報に着目しました。道路構造に着目した研究では、様々なスタイルを自由に取得でき正確な教師ラベルが得られるデジタル地図をソースドメインとし、道路構造の特徴を抽出できるようニューラルネットワークを学習します。そして、特徴分布の一致を行うドメイン適応により、教師ラベルがない任意のイラスト地図に対する道路のセグメンテーションを実現します。交差点情報に着目した研究では、交差点の位置情報を教師ラベルとし、デジタル地図に対して、交差点を抽出できるようニューラルネットワークを学習します。そのネットワークをイラスト地図に対する道路セグメンテーション結果に適用することで、イラスト地図からの交差点抽出を実現します。これらの結果や学習により得られた特徴を用いて、実際の道路構造との同定を目指します。

・地図道路補間

緯度経度情報のない観光用イラストマップの現在地特定手法研究の一環でイラストマップの道路形状を抜き出し、その交差点情報から地図の特徴を抽出する必要があります。道路抽出結果にはイラストマップには存在する道路部分が欠けてなくなる部分が多く存在し、道路特徴抽出のためにこの箇所を補完修正することが必要です。そこで、道路抽出結果には枚数に限りあるため、道路と背景に分かれた2値化地図を新たに用意します。その道路部分にランダムノイズを加え、故意に欠損部分を作成し、その部分を補完するような深層学習モデルの一種であるデノイジングオートエンコーダを構築することで、道路抽出結果の道路箇所を補完することを目指します。

上図の一部を拡大した道路の欠損部分※1

・線虫(C. elegans)の初期胚発生過程における異常検出

深層学習手法の1つであるVariational Auto-Encoder(VAE)によって正常な個体の特徴を学習することで、遺伝子機能を抑制した個体から異常を検出します。これまでの研究では、形状の異常や時間発展の仕方の異常を検出し、遺伝子機能の理解に繋げようとしてきました。他にも深層学習を用いた異常検出は、防犯カメラの映像から不審者を検出したり、工場において製品の欠陥を検出したり、幅広い分野に貢献することができます。

正常な細胞分裂と異常な細胞分裂※2

・赤外線距離センサを用いた視線ジェスチャ認識

視線入力インタフェースはハンズフリーな入力手段としてコンピュータの操作などに利用されています。特に、ウェアラブルデバイスにより視線をキャプチャするために、カメラを用いた手法や眼電位センサを用いた手法などが研究されています。一方で、赤外線距離センサという物体までの距離を測ることができる比較的安価なセンサがあります。このセンサを用いて眼球移動が認識できるかの検証は未だされておらず、可能であればより安価なウェアラブル視線入力インタフェースを実現するために有用であると思われます。本研究では、センサを搭載したメガネ型デバイスから得られたデータに機械学習モデルを適用することで、最大20種類の視線ジェスチャを識別します。そして、安価な赤外線距離センサを用いて、どんな人・環境でもハンズフリーで視線入力できるシステムを目指します。

視線ジェスチャ認識

※1 © Mapbox © OpenStreetMap

※2 Worm Developmental Dynamics Database, http://so.qbic.riken.jp/wddd/cdd/index.html, (2021/06/04)


 立命館大学 情報理工学部 知能情報学科


Copyright © 2008 Computational Intelligence Laboratory All Rights Reserved.