コンピュータと人。頭脳の対決。名勝負が続く将棋・電王戦

電王戦第4局。東京・六本木・ニコファーレで行われた大盤解説の様子。

涙の引き分け

プロ棋士とコンピュータの対決。将棋・電王戦

4月13日、第4局が東京・千駄ケ谷の将棋会館で行われた。

今シリーズの対戦成績はプロ棋士が1勝、コンピュータが2勝。

塚田泰明九段が負ければ、団体戦五番勝負トータルでもプロ棋士側の敗北が決まってしまう。歴史的大一番だった。塚田九段の対戦相手は、昨年、故・米長邦雄将棋連盟会長に勝った「ボンクラーズ」の強化版、「Puella α(プエラアルファ)」。富士通研究所に所属する伊藤英紀氏が開発した。第21回世界コンピュータ将棋選手権で優勝したソフトだ。

対局開始から塚田九段に勝機は訪れなかった。悪手は一手も指していない。にもかかわらず、コンピュータ有利の局面が続いた。終盤には塚田九段が必敗の大勢になったが、粘りに粘って引き分けに持ち込んだ。王が敵陣まで進みあって、お互いに勝ちがない状態、持将棋となった。

230手の激しい戦いが終わり、観戦記者から「途中で投了を考えましたか?」と聞かれた瞬間に塚田九段は言葉を失った。身体の動きも固まった。「いいえ、自分からは‥‥(投了したくなかった)」と言うのが精一杯で、目を赤くして落涙した。コンピュータに負けてはならない。並大抵ではないプレッシャーが塚田九段を襲っていたのだ。

現時点でプロ棋士に勝ち越している。天才と言われた現役九段が、引き分けに持ち込んで男泣きするほど強くなった。いったいコンピュータ将棋に何が起きているのか? この進歩は何によってもたらされているのか?

双方の王に詰みがないため引き分けと判定された
双方の王に詰みがないため引き分けと判定された

機械学習と評価関数

将棋というゲームは前半と後半で性格が異なる。前半は価値基準が抽象的だ。芸術のようだ。プロ棋士や将棋ファンたちは「形がいい」「筋がいい」「駒が働いている」「陣形が美しい」といった言葉によって前半戦を語る。たいして後半の価値基準は具体的だ。計算がすべてである。敵よりも早く王を詰ませるための最善手だけを追究していく。

当然ながらコンピュータは後半に強く、前半に弱かった。90年代の市販将棋ソフトでも終盤戦は思考がしっかりとしていたが、前半はすきだらけだったのである。ところが近年、コンピュータは苦手を克服した。思考のためのプログラムが格段と向上したのだ。

第一の要因は機械学習である。データベースから膨大な数のサンプルを解析。その解析をもとに有用な規則、判断基準などを抽出してアルゴリズム(算出方法)を発展させることができるようになった。コンピュータは局面だけを見て「形がいい」の判断ができない。だが、同じ局面を何度も見ていくうちに、どの手順で指せば、良い結果が出る確率が高いか。記録を蓄積して学習するのである。

第二の要因は評価関数である。将棋は勝負事の鉄則通りで、形勢有利のときと不利のときでは判断基準が違う。有利ならば安全策で逃げ切りを狙う。不利ならば逆転を狙った積極策に打って出なくてはいけない。形勢を正しく数値化することによって、有利不利の判断をする。その基準値となるのが評価関数だ。電王戦第2局で、佐藤慎一四段に勝った「Ponanza(ポナンザ)」の開発者、山本一成氏は自身のブログ評価値の一部を公開している。

また山本氏は 「チェスの指し手の選択肢は10の120乗、将棋の指し手の選択肢は10の220乗とすると、計算すべき数が多い将棋は開発するのが大変ではないのか?」の質問に対して、次のように語っている。

「選択肢の数ですべてが決まるわけではありません。チェスの駒は大きく動くので、置き場所によって評価に差がつきやすい。ですが、将棋の駒の動きは小さいので局面理解が難しい。たとえば1枚の歩がどこにあるのか。小さな位置情報を評価値に変えることがチェスと比べると難しいのです」。

ちなみに「Ponanza」は一秒間で3000万~4500万手を読めるそうだ。まさに桁外れの計算能力だ。コンピュータは膨大な選択肢を計算することは苦にしない。それよりもどの手が最善手なのか。評価する基準づくりが最終的な強さにかかわってくる。

最終局は頂上決戦

この数年で劇的に強くなったコンピュータ将棋。2010年には清水市代女流王将、2012年には故・米長邦雄・将棋連盟会長(永世棋聖)に勝った。そしてついに2013年4月、現役の男性棋士に連勝したのである。大きな節目を迎えた。人工知能の専門用語でいえば「シンギュラリティ──技術的特異点を迎えた」といえるだろう。

電王戦第5局(最終局)は現役プロ棋士の中でも最上位「A級」に属す三浦弘行八段が登場する。三浦八段は、かつて羽生善治七冠王から一冠(棋聖位)を奪ったこともある。

対戦するコンピュータは、東京大学大学院総合文化研究科の教員・学生が開発した「GPS将棋」である。昨年開催された第22回世界コンピュータ将棋選手権で優勝している。「GPS将棋」は、汎用PCを大量につなげた演算処理、クラスタリングと呼ばれる技術を使っている。今回の対局にむけて、東京大学は学内にある700台以上のPCを「GPS将棋」に提供することを特別に許可した。

1秒間に約2億8000万手を読むとも言われる「GPS将棋」と、A級棋士・三浦弘行八段の戦い。「GPS将棋」が勝てばコンピュータの3勝、1敗、1引き分け。三浦弘行八段が勝てば2勝、2敗、1引き分けとなる。第5局は4月20日に行われる。