特集「若手の会」が発信するAIの最前線
人工知能の最近の話題 ~ビジョンへの応用の視点から~
1. はじめに
近年、Deep Learningに代表される人工知能の研究が注目を集め、多くの研究者がこの分野に興味を持ち、精力的に研究が行われるようになった。このトレンドのきっかけとなったのが、ImageNet Large-Scale Visual Recognition Challenge 2012 (ILSVRC 2012)である。ILSVRCは画像中にある物体の認識やセグメンテーション(切り出し)アルゴリズムの性能を競うコンテストである。これまで、数年かけて正解率がようやく2〜3%向上していた状況の中で、Hintonらが提案したAlexNet(1)が10%以上の大差で優勝した。
本稿では、自律ロボットなどの知能機械の実現に必要な機能として、実用レベルにまで達した人工知能を用いた画像認識の最近の状況について紹介する。これまでの画像認識は与えられた画像をいかに精度良く認識するか(Passive Static Vision)という課題設定であった。人工知能の性能が向上した結果、どのような視点からどのような画像を撮れば認識が容易になるか(Active Vision)という研究の流れが加速している。Active Vision自体の考え方は以前からあったが、人工知能の能力が向上するにつれて、より現実的な問題を解けるようになってきた。
以下では、Passive VisionからActive Visionの流れに従って、最近の代表的な研究成果について述べる。
2. CapsNet
最初にConvolutional Neural Networks (ConvNets)が注目されたのは、HintonらがILSVRC 2012で発表したAlexNetであった。その後、ConvNetsが、ILSVRCで主流の方法となり、ConvNetsを用いた手法の一つであるResNet(2)はILSVRC 2015で人間の能力を超える性能を達成するに至った。しかしHintonらは、特徴量の相対的な位置関係などを直接利用していないConvNetsには問題があると考え、画像中での特徴量の相対位置関係を利用した新たなアーキテクチャであるCapsNet を提案した(3)(4)。
キーワード:特集
【表紙の絵】
何でも作るくん
田中 雄惺くん(当時8歳)
何でも作るくんが何でも人が作りたいぶひんを出しかんせいまで作ってくれる。