C02: オセロゲームAI

概要

ニューラルネットワークを活用して、オセロゲームの次の一手を決める人工知能を構築しました。入力する特徴量を工夫した結果、ランダム選択相手に最大82%程度の勝率を得ることができました。


Movie


Memo

入力層: 各マスの色(64次元3値)、黒石総数、白石総数、空マス総数、黒-白総数の差分、次の一手においておけるマスの数、4隅黒総数、4隅白総数、4隅空マス総数(合計72次元、0-1規格化)

出力層: 過去その場面が登場した対戦において白黒どちらが勝っていたか(白勝利1、黒勝利0、1次元)

中間層: 30次元

学習方法: 際急勾配降下法

階層: 3層階層型

学習係数: 0.5

学習回数: 20000回(ただし、800回のとき最も強い)