特徴量空間評価関数 E2H MRS と局所解を回避する空間探索アルゴリズム BS-FSの提案

特徴量空間評価関数 E2H MRS と局所解を回避する空間探索アルゴリズム BS-FSの提案

Abstract

一般に、教師あり学習法(サポートベクターマシン、ニューラルネットワーク、決定木など)を用いて分類モデルを開発する場合、計算コストの削減や汎化性能の向上の観点から、前処理として特徴量の選択が不可欠である。この分析として、特徴量選択アルゴリズムの一つであるMRS(Minimum Reference Set)を用いることができる。従来提案されたMRSは、少量サンプルに基づく 1-nearest neighbor アルゴリズムを用いて、全てのサンプルを正しく分類することができれば、その特徴量の部分集合は有効であると解釈する。しかし、オリジナルのMRSは連続的な特徴量にしか適用することができず、異なるクラス間の距離を考慮することができないという欠点があった。

そこで本論文では、連続型特徴量とカテゴリカル型特徴量の混合により構成される特徴量空間に適用可能で、かつ、異クラス間距離を評価に考慮した新しい特徴量部分集合評価アルゴリズムとして、E2H距離荷重型MRSを提案する。さらに、有効な特徴量の部分集合を発見するための探索アルゴリズムとして、局所解の回避する効果を有する Bayesian Swap Feature Selection Algorithm も提案する。提案手法を数値的特徴量とカテゴリカル特徴量の混合によって構成された特徴量集合によって検証した結果、その有効性が認められた。

Publication

  • Yuto Omae, Masaya Mori, E2H Distance-weighted Minimum Reference Set for Numerical and Categorical Mixture Data and a Bayesian Swap Feature Selection Algorithm, Machine Learning and Knowledge Extraction, vol.5, no.1, pp.109-127, 2023.01. doi: 10.3390/make5010007 [IF: xxx] [採択率: 43.0%] [Link]

Note

この記事および画像は有償サービスにより作成されたものであり、本ページのみでの利用を想定しています。無断利用を発見した場合はご一報ください。

文責: 大前佑斗

日本大学生産工学部マネジメント工学科 専任講師、人工知能リサーチセンター 研究員。ゼミ配属では、プログラミングや人工知能を、時間をかけ丁寧に学習したい方を募集しています。文系・理系、どちらでもokです。

コメントは受け付けていません。