深層学習の汎化理論に関する研究を行いました!

深層学習の汎化理論に関する研究を行いました!

ニューラルネットワークのクロスエントロピー損失の「鋭さ」を閉形式の関数として導出することに成功しました。
深層学習がうまくいく条件の解明に取り組む内容です。

Title:
Wolkowicz-Styan Upper Bound on the Hessian Eigenspectrum for Cross-Entropy Loss in Nonlinear Smooth Neural Networks
非線形平滑ニューラルネットワークにおける交差エントロピー損失のヘッセ行列固有スペクトルに関するウォルコヴィッツ-スティアン上界
Arxiv: https://arxiv.org/abs/2604.10202
pdf版: https://arxiv.org/pdf/2604.10202

2020年代に提案・検証されてきた深層学習のFlatness仮説と関連する内容で、半年間、苦しみながら研究を続けました。
興味がありましたら、ぜひご覧ください。

本研究室ではこれからも、深層学習の謎の解明を目指し、追求を続けます!

文責: 大前佑斗

日本大学生産工学部マネジメント工学科 専任講師、人工知能リサーチセンター 研究員。ゼミ配属では、プログラミングや人工知能を、時間をかけ丁寧に学習したい方を募集しています。文系・理系、どちらでもokです。

コメントは受け付けていません。