Modeling

どのモデルで実現するか?
ニューラルネットなのだろうか?
本当の意味で、ニューラルネットに、オセロの学習をさせようと思ったら、もう少し、複雑なニューラルネットを構築して、受け取った出力の判断方法も変えなきゃいけないんだと思うよ.でも、そこまでやってる余裕は無いから、今回は、ボードの升目をニューロン1個と考えてみた.結局,このニューロンは、1:黒,−1:白,0:無しの3つの値を採るし、出力も、計算して、一番値が大きくなった所を第1候補と採用する仕組みを考えてるので、本当の意味でのニューラルネットには、ほど遠いかも知れない.ニューラルネットの学習方法を利用したオセロって感じかな?
(Nov.25/2000)

  • ホップフィールド
    オセロのボードには、64個の升目が有って、これが白か黒になるわけだ.即ちニューラルネットの考え方に、すんなり当てはめられそうだと考えたのが発端,まずは、難しい事考えずに、全てのニューロンを相互結合した、ホップフィールドネットワークをモデルに考え始めた.
    (Nov.25/2000)

  • 変形ホップフィールド
    但し、ニューロンの値は、白:1と黒:−1,及び無し:0という3値を採る形を採った.学習段階で、相手が無しの場合は、学習を行わない.かえせる石の数が多い程、ニューラルネットは、その場所を強く指し示すだろうと推測した.但し、出力は、今有る石の状態は変更せず,一番高い数値を示した場所を採用する.と言った方法になると思う.最初のうちは、置ける所の中からランダムで選出べば良い,そして、ニューロンの主張がある値より強くなった時点で、そちらに切り替える方針,(Nov.25/2000)
    結果的に、優劣を付けなければいけないので、計算結果を入れておく裏ニューロンが必要になる.これで、とりあえずは実験を開始する予定.(Dec.20/2000)

  • パーセプトロン
    パーセプトロンは、パタンの認識を得意とするので、64−63−64のパーセプトロンを形成し、学習結果,最善手を出力層に出力するというモデルも考えられる.ホップフィールドが、思うように動作しなかった場合には、これについても、試してみる予定.現時点では、計画のみ.(Dec.21/2000)


Since Nov.25/2000 last update Dec.21/2000,

Return