書評『アルファ碁 Teach完全ガイド』-Do humans dream artificial inteligence?-

『究極の囲碁上達ツール アルファ碁Teach完全ガイド』を読了したので、その書評を掲載します。

本書は2018年07月24日初版第一刷発行、著者は囲碁AIの第一人者である大橋拓文プロです。

本書の評価

今まで同著者の書評を2冊ほど書いてきました。

大橋拓文著『囲碁AI時代の新布石法』を読了したので、レビューを掲載します。 本書は、2017年7月31...
大橋拓文著『よくわかる囲碁AI大全』を読了しましたので、書評および考察を以下に記述します。 一言で言う...

でも、これらよりも評価するのが難しい。この上なく難しいです。

結論から言いましょう。

表面だけの評価なら10点満点で3点で、メタ要素含めての評価なら8点です。

最初に一つ注釈を入れます。

今回はかなりの量の引用をするため、長い引用に関しては太字部分以外は読み飛ばしてもよいようにしてあります。太字部分以外も引用するのは、ただ著者および書評の意図が正確に伝わるべきだという考えに従うモノです。

では一つ一つ見ていきましょう。

有意差の問題

まえがきでは、このように述べられています。

2017年12月、アルファ碁ティーチが公開されました。アルファ碁の布石構想と勝率を知ることができる学習ツールです。2016年のアルファ碁登場以来、囲碁AIの進歩は止まる所を知らず、二年足らずで、囲碁AIから学ぶことができるようになりました。囲碁AIが特に強いのは序盤で、その勝率による評価値を見ることができる、ということはとても興味深いです。
しかし一方で、囲碁AIの手はこれまでの人間の常識と違うところもあり、それをそのまま取り入れるのはなかなか難しいことです。そして囲碁AIはこれからも増々強くなっていくでしょう。
これからどのように囲碁AIと付き合っていくのか、この本の執筆にあたり、私なりに考えました。アルファ碁ティーチを見ていてどんな時に一番嬉しいかと問われれば、これまで考えもしなかった手を見たとき、と私は答えるでしょう。もちろん、使いこなせなければ勝てないかもしれません。
しかし新しい手を見て、それはなぜかと考え、新しい発想に至る。ここに喜びがあり、囲碁の新しい楽しみ方になるのではないかと。(後略)

この囲碁AIと付き合っていく上で、絶対に避けられないのが「評価値」です。

この評価値(形勢判断)に関して、本書では以下のように説明されてます。

人間はこれまで「黒10目優勢」というように目数で形勢判断をしていましたが、アルファ碁は、「黒55%」などと、勝率で形勢判断をします。アルファ碁ティーチでは1手につき一千万回のシミュレーションをして得られた値を勝率として表示しています。つまり勝率55%ならば、終局まで一千万通りを想定し550 万回黒が勝ったという事です。

(中略)

目数による形勢判断と違う点は、黒は47%からはじまり、互角のワカレで手数が進んだ場合は、パーセンテージは緩やかに落ちていくのが普通です。

なぜかというと、盤面に打つ場所が少なくなれば、それだけ有利な方は勝ちに近づいているからです。初手で47%ですと、ティーチが示す30手で45%なら黒が頑張った布石と言えるでしょう。

(中略)

アルファ碁ティーチの説明文には「アルファ碁は必ずしも最も勝率の高い手を選ぶとは限りません。アルファ碁の探索にはランダム性があり、その時々の違う探索で別の打ち方を選ぶ可能性があります」(筆者訳)ということが書かれています。

アルファ碁の探索のランダム性とは、どれくらいの範囲でのことなのでしょうか? 例えば、最初の四手を見てみるとほとんどが星と小目で、たまに三々(囲碁の未来サミット、柯潔九段との第2局)が見られる程度です。初手の勝率を見ると星から三々までは46、47%の1%内の範囲に収まっていますが、高目から下は45%台ですね。私の見る限り、おおよそ1%違うとアルファ碁が勝率の低い方に打つことは少ないですが、0.5%程度の範囲だとアルファ碁の探索も揺れ動いています。0.2%差の第一候補と第二候補の想定手順をたどっていくと、勝率が逆転することもしばしばあります

この1%以下の揺らぎがティーチを見る上で悩ましい問題です。誤差とも考えられますが、無視できるほど小さくもない。囲碁AIと対局すると、はっきりとした悪手を打ってないのに差がついていることがとても多いです。1%程度の積み重ねがそうさせているのでしょう。

マスターの60局では1手5秒程度で打つ設定でしたが、ティーチでは一千万シミュレーションで、読みの深さが違います。ティーチで見比べると、この長考で0.5%程度良い手を見つけていることがしばしばあります。1%以下の揺らぎはアルファ碁の課題ですが、逆に言えばこれを追求することで、まだまだ強くなる可能性があると言えます。
本書では、この1%以下については、私の解釈で解説を加えました。アルファ碁の想定図とは違うかもしれませんが、そこは人間の視点をお楽しみください。

さあ、すっごく長い引用になりましたが、ここで大きな問題が発生しています。

「有意差」の問題です。

勝率49%と勝率49.5%という差分は、意味のあるものなのか?という問題です。

そして、これに対して著者は、上述の通りかなり曖昧な答えでスルーしてます。これが囲碁AIが上手く利用してされていないポイントの一つだと言えます。

別事例で有意差について試しに考えて見ましょう。

血圧の薬A,B,Cの3種類があります。

A’という論文では、Aは高血圧の患者さんの8割に効果があったという結果が出ています。

B’という論文では、Bは高血圧の患者さんの6割に効果があったという結果が出ています。

いずれもCという既存の薬と比べて有意な効果があったかを比較した論文でした。

さあ、これをもって、血圧の薬の優位性として、A>B>Cと言えるでしょうか?

言えないです。絶対に言えないです。

A>C、B>Cという関係性は言えますが、AとBを比較してはいませんから、絶対にダメです。

同じような条件(に見えるような形)で書きましたが、実際対象人数規模が異なるものだったり、患者さんの背景(人種、食生活などなど)が異なるものだったりするので、ダメダメです。

要は、比較するならば正しく比較しなくちゃダメです。

薬の有用性を比較するときに行われるのは、RCT(Randomized Controlled Trial)です。まあ、脱線しても仕方ないので、細かい説明はWikiに任せるとして……。

重要なのは、本当に比較したいもの以外の条件を揃えて、同じ尺度で比較しなくちゃいけないってことです。

話を戻しましょう。

勝率49%と勝率49.5%に有意差があるかどうかは、まずこの二つを比較する指標がないと、比較になってません。本来囲碁AIで囲碁を追求するなら、この方向性に着手すべきでしょう。

つまり、本書における評価値に対する吟味は、全て客観性の面で有意ではありません。

ついでに比較対象の話もしたくなるのですが、本書の方向性とは異なるので、割愛します。

誰向けの本なのか?

本書の出版元のサイトの画像を見て気づいた人はいるでしょうか?

備考:初~中級ってなんぞや?

と本気でツッコミを入れました。

以前囲碁AI本に関するお話を書きましたが、初心者や中級者では読みこなすのは無理です。詳しくは以下のリンクをご覧ください。

『棋書(囲碁の本)の扱い方(2016年版)』(以下「前作」と称します)を出して、1年半が経ちました。 ...

一般的な話をしても意味がないので、本書の場合も他の囲碁AI本と相違ない点を提示します。

第1章の楽しみ方としてこのように本書では言及されてます。

(前略)

この5局を戦ったバージョンはアルファ碁リーと呼ばれています。このバージョンは人間の棋譜学習の影響もあり、バランスが良く中央感覚に優れています。アルファ碁リーが見せた斬新な手法には、多くの人が驚き、囲碁の考え方に大きな影響を与えました。しかし、アルファ碁リーが優勢を引き寄せたと言われ、人間に賞賛されている一手をティーチでは反省したりしています。その内容を詳しく検討してみると、アルファ碁ティーチ=マスターのように最後まで打てるなら良い手、というものがとても多いです。マスターの後半力によって成り立っているので、とても難解な変化を含んでおり、現在の人間に適してないと思うこともしばしばです。

なので気楽に次の一手クイズだと思って当てっこを楽しんでください。そんなんでいいのか
!?と突っ込まれそうですが、まずは驚き、楽しむことから入りましょう。もちろん、ティーチの構想を見た上で、私なりに人間に合う打ち方を示したところや、解説を加えたところもありますので、深く知りたい方はじっくり読んでいただければと思います。

(後略)

私としては、エンタメに走る方向性に対しては一切文句はないです(好きかどうかは別として)。問題は、そのエンタメの対象です。

例えば、この黒1。

有段者だとかなり驚きの手だと思うんですよ。妖刀定石ではなくこの選択……。

でも、級位者目線だと小目の代表的な定石として知っているのがツケヒキ定石くらいですから、あまり驚きがないというかもしれません。

わかりますかね、このギャップ。

「驚く」ということは、ある程度前提知識がないと無理な行為なんですよ。

だからこそ、私は以前、

「どんなに初心者向けに解説しようとしても、絶対に説明不足になります。本という枠組みに入れている限り、これは避けられない事象です」

とまで表現して、先のリンクの内容を書きました。

私としては、この出版社は本当に新規読者を取り込みたいのか、と疑うレベルです。

解説書の「問い」の意義

解説書に問題演習要素を入れても、Outputにはほとんど役に立たない、と明言します。

問題演習をやらせるなら、最低100問は用意しなくちゃダメです。

解説書の問題要素は、Inputの役に立たせるものです。思考起点を明示し、読者に考えてもらい、頭の中で整理(Sort)しやすくさせるものです。

この関係性でやらかしたのが5章です(画像でも文字でも触れたくないので、中身はご自身でご確認ください)。

というか、この系統のやらかしをする囲碁の本……ちょっと増えましたね。

企画者もそれに同意する人たちも、もうちょっと一般書を読むべきだと思います。

教育系の人間だと当たり前のことだと思うのですが、門外漢の人だと難しいですよね……。(と言葉を濁しておきます。)

ついでにもう一個私的な苦言を書きますが、他著の本を推奨するのはもうちょっと考えてください。お願いします。それが本当に良い本なら構わないのですが、幼稚な本は死んでも買いたくないです。

ストーリー判断と点判断

囲碁AIがストーリー判断(流れで判断)ではなく、点判断であることを前提として、話を進めます。(ストーリー判断に関しての詳細はリンク先を参照)

大橋拓文著『囲碁AI時代の新布石法』を読了したので、レビューを掲載します。 本書は、2017年7月31...

あの前節で苦言を申した5章ですが、求めている内容に関しては分からなくはないです。

抜粋しますが……

この章の狙いは主に二つあります。
① 形勢判断を直感的にできるようになる
② 局面ごとに捉える目を養う

誰しも、相手の石音がした方に引っ張られて、大事なことを見逃してしまった経験があるのではないでしょうか?

問題図ではそこに至るまでの手順は隠してあります。手順の情報に引っ張られないような思考回路を作ることが本章の目的の一つです。

「点判断をできるようにする」という方向性が本当に可能なら、この目的提示はアリでしょう(普通の人間に可能なら)。

※私はストーリー判断を提示すべきだと思っている人間なので、個人的には反対です。

私がここで提起したいのは、点判断での解決が正しいのかどうか?です。

きっと点判断で解決したいのは、これだと思うんですよね。

誰しも、相手の石音がした方に引っ張られて、大事なことを見逃してしまった経験があるのではないでしょうか?

んー、これは点判断で解決になるのでしょうか?

相手の石音に引っ張られる人は、自分の打った手(それまでの経過)に対して無頓着なことが多いです。私見ではありますが、これが一番の特徴だと思います。

言い換えるならば、元々盤面に存在している石から読み取っている情報量が少ない、という表現になります。

実際の例で考えてみましょう。

昔からある手段ですが、白5まで左下の黒のカカリに対してハサミやすい状況を作ることができました。

白1といきなりハサミを打つと黒4まで白1の石が孤立してしまい、右下に侵入することが難しくなります。

上述の流れを知った上で白1と打つでしょう。

では、黒はどうでしょうか?

この図を想定していたのなら、まずこの予定プランは崩壊ですね。

でも、これが白が打ちづらいという認識があるなら、さらに奥を目指せますね。

白3と打たれて気づくかも知れません。右下と左下が見合いになっていると。

でもプランを差し替えれば良いだけです。白1~黒4の交換がどういう違いを生み出しているのかを考えながら……。違いが分かれば、プランも立てやすいですよね。

下辺は黒に有利なフィールドから白の強いフィールドに変わったので、黒は軽くサバくのが正しい態度です。

で、ここで失敗するパターンは、元々のプランに囚われるパターンです。

つまり、下辺を黒の勢力圏にする予定だったのだから、下辺で頑張って戦う方針……

→無理に決まってます(理由はすでに示した通り)。

今回の事例で提示したのは、ストーリー的な判断手法です。元々あった石にどんな意義があったか、増えた石によってそれがどのように変化したかを踏まえて考える。これが一番自然な手法だと思います。

実際、私自身が5章を読んだときは、手順が示されなくても大体の手順は想定できました。あとは見慣れない碁形なので、普段とどのように違うのかを元に、提示すべき次の一手の焦点はどこなのか、を考えることができました。(もちろんそれが正答だったかは別として)

あとは、手抜きとか捨て石の考え方がきっちりないとキツいかもしれませんね。

よく「上手くいかないから手抜く」とかいう人がいますが、それが軸だと囲碁AIの感覚にはついていけないでしょう。

まあ、本当に捉えるべきはいわゆる「大局観」全体のバランス感覚だと思うんですけどね。

でもそれって、手順があった方がすごくわかりやすいんですけどね(説得もしやすいし)。違うんですかね……。流派のような問題かもしれませんが……。

総括

最初に示した通り、

表面だけの評価なら10点満点で3点で、メタ要素含めての評価なら8点です。

表面の部分はここまで示した通りで、散々な減点要素にまみれてます。

でも、ここに「評価値への正しい対応を覚えて欲しい」という著者の意図があるとしたら、かなりの要素が逆転します。

「有意差が提示できない=上手く比較ができない=不確かな情報」の中でプロ的にはどのように判断するのか、を提示しています。その断片は本文中の各所にちりばめられています。

ただ、それを読者が読み取れるかと問われると……、

囲碁の言語化レベルを考慮すると、かなりキツいのではないか、というのが私の見解です。

まあ、この意図も私の想像でしかないので、合ってるのかは分かりませんがね……。まあ合ってるなら、人がAIの夢から覚めるには、時代がもうちょっと前進しないとキツいでしょうな。

次回作では、もうちょっと教育のこと比較のことを考えて欲しいな、という私の勝手な願いを込めて、今回の書評とします。(なお、分からないなら専門家に聞いてください)