棋譜からの学習について保木さんから

棋譜からの学習について保木さんにメールで直接教えていただきました


保木さんのご厚意により、メールで質問して構わないということでしたので、私は厚かましくもメールで根掘り葉掘り質問させていただきました。

保木さんに教えていただいた情報のうち、保木さんが公開して良いとおっしゃられた部分に関してはこのブログにて公開させてもらいます。

今回はBonanzaで学習に使用した棋譜についてのことです。以下は保木さんから私へのメールです。

学習に使用したプロ棋士棋譜 45833 局です。入玉模様の棋譜は1000局以
下だと思います。入玉の局面を Bonanza は殆ど評価することが出来ません。

昔はアマチュア棋譜入玉模様のサンプルを増やしていたのですが、最近は
しておりません。しかし、将来また使用するかもしれません。用いた Xeon
Harpertown 程度のものだったと思います。

学習の過程で勝率が上昇していく様子等のデータはありません。本来ログファイ
ル等取っておくべきですが、リスタートやマシン移動等を途中ではさんでいて断片
的にしか残っておりません。

どのように学習させても大体同じだと思うので、あまり神経質になる必要は有りま
せん。私が今やるのであれば、以下のようにします。

1.CSA 形式の棋譜と学習用 PC を用意し、64ビットモードでコンパイルする。

2.learn1.c の SEARCH_DEPTH を 2 にセットしコンパイルBonanza のコマ
ンド

> learn ini 32 -1 -1 8 8

を実行して1ヵ月程度放置。

3.次に、SEARCH_DEPTH を 3 にセットし、param.h_ と fv.bin を使用して続きか
ら学習。PC を止めたくなった時に学習をやめる。

これで私は長年疑問に思っていた学習の謎が解けました。
これでもはや誰でもBonanzaのfv.binが作れるようになるわけですね!


Xeon Harpertownは5400系で、Corei7 Extreme 975なら5400系×dualとなら互角〜数割遅いぐらいでしょうから、同じ〜数割遅いぐらいの時間で学習が完了するのではないかと思います。


あと、現行のXeon 5500系とくらべるとHarpertownは同クロックで半分ぐらいの性能と言われているので(実際に測定したことはないのでよく知りませんが)、現在最上位のW5590×dualなら半分ぐらいの期間で終わりそうですね。つまり2週間+α。長いような短いような。