ChatGPTが質問に答えてくれたり、テキストから絵師が書いたような画像を生成できたりと、AIに関する話題がニュースやSNSで取り上げられる機会が増えています。ChatGPTは深層生成モデル、絵師のような画像生成には拡散モデルと呼ばれる技術によって支えられています。私の研究では、深層生成モデルや拡散モデルを応用することで、画像データ内の異常を検知したり、注目する領域の可視化を行ったりしています。現在は医療画像データを対象とし、腫瘍領域の検出タスクに取り組んでいます。とても小さな腫瘍や、腫瘍と正常臓器の境目など、人間でも判別が難しいような領域の検出を試みることで、医師の作業量削減や誤診防止などに貢献できると考えています。ゼミの中で教授や先輩後輩と議論することで、目まぐるしく発展するAIについて深く理解し、更なる応用先はないか、より面白いことはできないか、とアイデアを出し合うことは非常に面白く、研究のモチベーションとなっています。
自動運転中における交通事故の発生を抑えるために、セグメンテーションによる物体検出に関する研究が進められています。セグメンテーションとは画像認識手法の一種であり、全ピクセルにクラス分類を行うことで、画像上のどの領域がどの種類の物体に該当するかを特定できます。セグメンテーションモデルの訓練には、入力用の画像と正解データからなるデータセットが必要です。そのため、画像1枚毎に正解データを作成しなければなりません。ただし、夜間の画像は視認性が悪く、手作業による正解データの作成が難しいため、十分な量のデータセットを用意できないという問題があります。これに対して、深層生成モデルにより昼間の画像の画風を変換し、疑似的な夜間画像として扱うことで、データセット不足を解消するという試みがなされています。私はそこに着目し、より本物に近い夜間画像を生成可能なモデルの確立に向けて、既存手法の調査や改善に取り組んでいます。