土曜日, 2月 13, 2010

思考ルーチンの評価データ(その3)

 v1.90リリースを目指して、新たな思考ルーチンの再評価をしましたので、またまた結果をアップします。
 データの読み方については、思考ルーチンの性格についての解説記事と、第1回第2回の記事を参考にお願いします。

 前回の評価で浮き彫りになったのは、v1.85で追加したパラメータ「仕事駒積載」がCの性格(慎重、技術重視、倹約家、協力的、長距離重視)が軒並み下位に沈んだという問題点です。これは「仕事駒積載」が2つ目以降の仕事の積載に慎重になりすぎているのが原因で、中盤まではそこそこ戦えるのだけど、終盤に追い抜かれるケースが目立つと分析しています。
 改良点の一つは、この問題を修正するもので、積載量が3つ以上の列車の場合、残りの空きが1つになるまでは普通に積み、最後の1つを積むときのみ慎重に判断するように修正しています。

 ところが今月になって、更にもう一つの原因があることが判明しました。そもそもこの2つ目以降の絞り込みにバグがあって、正しく絞り込まれていないというバグを見つけています。つまり、絞り込みの際に本来なら積み込むハズのものがちゃんと評価されずに積まれていなかったという問題があったんです。このバグの解消が2つ目の修正点です。

 3つ目の修正点は、空荷の場合に、次のターンの移動で届かない場所の仕事をせずに途中で仕事を拾うのを諦めてしまうケースが発生していたのを解消しています。これはコスト意識が高く、建設に積極的でない性格(地域路線網、慎重、倹約など)で多く発生していましたが、通常のマップではあまり発生するケースが少なかったのですが、「Merchant of Orion」や北陸マップになどでよく発生する問題でした。今回の追加予定のリプレイ機能によって挙動不審な動きの再現テストが容易にできるようになり、それによって発見した問題でした。これ以外にも発生頻度が低いおかしな動作をいくつか解消しています。

 4つ目の修正点は、初期配置時に、仕事駒のコストをちゃんと計算しておらず、報酬額の大きな仕事を取りたがるという問題です。これによりコンピュータは、最初にコストを度外視した仕事を選択して、大胆に建設するケースが多発していました。これを本来の計算式に修正した結果、倹約家や欲張りのように他人の路線を利用し、コスト意識の高い性格は、最初の配置では大都市を目的地とした小さな仕事を好んで選ぶようになり、早い段階から列車のアップグレードを行うようになっています。下手すると、人の路線を利用して建設すら行わず、いきなり第1ターンから積載量の大きな列車にアップグレードします。
 
 さて、こうした変更の結果、仕事駒積載がCの性格がもっと上位に進出してくるようになり、序盤から重要地域を選択して配置することが増えて、激戦になることを予想して、データを取ってみました。

 今回は国内8マップと海外8マップの計16マップで評価しています。前回の評価に比べて、海外のイギリスマップが増えています。それ以外のやり方は前回と同じです。
 さて、結果はどうなかったというと・・・



 なんか、前回よりも強い性格の勝利が増え、弱い性格の勝率が低下しています。
 勝率を見る限りは「仕事駒積載がCの性格がもっと上位に進出してくる」というのはうまく行っていないようです。
 なんでそんな結果になったのか、詳しく分析してみました。

1.優勝が上位3つの性格にはっきりと集まるようになり、それ以外の優勝確率が低下した。

 前回のトップの「標準」は勝率.467(15戦7勝)、2位の「欲張り」が.267(15戦4勝)、3位は5つが.200(15戦3勝)で並んでました。
 ところが今回はトップの「標準」が.500(16戦8勝)、2位の「地域路線網」が.438(16戦7勝)、3位の「欲張り」が.375(16戦6戦)と上位3つに優勝が集中し、上位3つでほぼ3分の2の優勝を独占するという状態なってます。
 これは初期配置の計算式の間違いにより発生していた運・不運の要素が減少し、序盤からどのプレイヤーも優位な場所を確保するようになったため、結果的に実力が発揮されるようになったためと思われます。
 今回の評価の影響で一番はっきり出たのは、初期配置の不具合解消で、これに仕事駒積載Cの改良の効果がかき消されてしまっているように見えます。


2.上位にくる性格は必要な路線を建設する性格と仕事を沢山確保する性格

 路線の建設に関しては面白いことに、路線の建設に積極的かどうかが必ずしも路線の長さに反映されないようになっているという点です。一番はっきりしているのが「標準」で、前回の評価では「標準」は一回も路線長のタイトルを取ってないのに、今回の評価では最多の9回も取っている。この点は今回の思考ルーチンの修正では何も影響するような変更を行ってないので非常に疑問だったのですが、どうやら仕事を取ることに対する積極性が関係しているようです。
 つまり、そもそも仕事を積んでなくって、やって得するような仕事が近くに無いなら、路線の建設なんかしないんです。
 だから仕事を確保していることが多い性格の方が線路をよく作る。
 これはたぶん、重要な地域に多くのプレイヤーが集中し、結果的に仕事の取り合いが激しくなって、辺境の地域に仕事がたまりやすい状況になっているのではないかと思われます。
 だから、最初から仕事を沢山確保する傾向にある「地域路線網」・「欲張り」・「仕事重視」や、必要な路線はちゃんと引いて、選り好みし過ぎずに仕事を取りに行く「標準」や「建設重視」が上位にいるんだと思います。
 それに対して建設に積極的でも仕事に対して選り好みのある「広域路線網」や「長距離重視」は仕事を確保できず、その結果路線長が伸びなかったのではないかと分析しています。

3.仕事駒積載Cの性格は優勝回数は伸びていないが、資産平均順位は上昇している
 ここまでの分析では仕事駒積載Cの改善は失敗しているように見えますが、実は資産平均順位を見る限り、仕事駒積載Cの強化は効果を上げています。
  長距離重視  平均順位:前回 5.13 → 今回 4.19、 優勝回数:前回 0 → 今回 0
  協力的    平均順位:前回 4.47 → 今回 4.44、 優勝回数:前回 0 → 今回 1
  倹約家    平均順位:前回 4.00 → 今回 3.88、 優勝回数:前回 1 → 今回 1
  技術重視   平均順位:前回 3.87 → 今回 3.63、 優勝回数:前回 2 → 今回 1
  慎重     平均順位:前回 2.60 → 今回 2.50、 優勝回数:前回 2 → 今回 1
 このとおり、幅の大小に違いはあれど、全ての性格で平均順位がアップしています。特に長距離重視はめざましい改善です。
 優勝回数はトータルでは1回減っていますが、激減というほどのことはありません。上位3強の勝率の急上昇は少なくともこのグループを踏み台にしたものではなくって、中間層の他の性格の勝率を減らして稼いだものなのです。
 それに、優勝回数の減少には運の要素もかなりありそうです。優勝0回の長距離重視は、2位は5回もあります。優勝1回の慎重は2位が9回もあります。優勝と2位の間にははっきりとした実力差があるとは思いますが、これだけ2位があるとなると、惜しくも敗れたゲームも多いはずです。
 それからもう一つ、トップの「標準」は、前回に比べて優勝を増やしてますが、平均順位は落ちてます(2.40→2.69)。

今回の結論

 ・初期配置の不具合解消の結果、重要地域での接近戦が増え、仕事の確保や線路の建設が積極的な性格が強くなった。
 ・個々のゲームの中では差が開きにくくなり、接戦が増えているのだけど、優勝には実力が反映されやすくなっている
 ・強い性格と対戦したかったら、「標準」・「地域路線網」・「欲張り」を選ぶと良い
  弱い性格と対戦したかったら、「長距離重視」・「協力的」・「倹約家」を選ぶと良い

 最後に付け加えて置くと、今回の追加機能「リプレイ機能」は思考ルーチンの不具合の改善と、評価データの取得では非常に強力な武器になりました。もっと早くこの機能を作っておけばよかったと思いますねえ。

0 件のコメント: