画像を原子集合とみなした新たな画像特徴量の抽出手法を提案しました!

画像を原子集合とみなした新たな画像特徴量の抽出手法を提案しました!

機械学習において高いパフォーマンスを得るには、良い特徴量の抽出が必須です。ここで、原子同士の相対的な配置関係(=絶対座標の情報がない)を表現する特徴量として、Smooth Overlap of Atomic Positions が知られています。これは画像を対象としたものではありませんが、ピクセルを原子とみなすことで、画像データに対してもこの特徴量を計算することが可能となります。本論文では、この具体的な手続きを設計することで、新たな画像特徴量の計算手法を提案しました。これを機械学習モデルの入力として採用することで、単純なクラス分類・回帰問題に限らず、ピクセルレベルのクラス推定の問題を解くことができます。

研究途中であるため性能の面で従来手法より劣る部分もありますが、古典的な画像特徴量や深層学習ベースの特徴量とは異なる新たなアプローチであることから、今後どのように発展していくか未知数です。興味がありましたら、下記をご覧ください。

Eiaki V. Morooka, Yuto Omae, Mika Hämäläinen, Hirotaka Takahashi, Benchmarking Point Cloud Feature Extraction with Smooth Overlap of Atomic Positions (SOAP): A Pixel-Wise Approach for MNIST Handwritten Data [Link]

提案手法は、画像がシフトしたり、回転したり、反転したりしても、特徴量ベクトルの値が変化しないという強力な特性を有しています。ですから、深層学習で必須となる Data augmentation(データ水増し)をしなくて良いということになります。したがって、教師データの規模を大幅に削減することができ、学習の高速化やメモリ削減につながります。上述の論文では、mnistのデータで分析を行っています。回転不変などの特性から、6と9を混同するなどの特徴が見られました(6と9は回転すると同じになるため)。回転不変の特徴量のデメリットですが、mnistデータセット特有のシチュエーションのみで起こる問題ともいえます。

この論文は、計算物理学を専門とするヘルシンキの学生との共同研究として仕上げたもので、大変おもしろく、海外派遣の良い思い出になりました。

文責: 大前佑斗

日本大学生産工学部マネジメント工学科 専任講師、人工知能リサーチセンター 研究員。ゼミ配属では、プログラミングや人工知能を、時間をかけ丁寧に学習したい方を募集しています。文系・理系、どちらでもokです。

コメントは受け付けていません。