再生核研究所: 無敵のポーカー・プログラム完成、カナダ研究

2015年1月29日木曜日

無敵のポーカー・プログラム完成、カナダ研究

【1月9日 AFP】プレーヤー2人に限定したポーカーの「テキサス・ホールデム（Texas hold'em）」で、理論上絶対に負けないコンピュータープログラムを開発したとする研究論文が、8日の米科学誌サイエンス（Science）に掲載された。

論文の主執筆者、カナダ・アルバータ大学（University of Alberta）のマイケル・ボーリング（Michael Bowling）氏はAFPの取材に、研究チームは2003年より「現在の超一流プレーヤーに負けない、またどんな戦略にも負けない、完璧なプレーヤーを作り出すこと」を目標に掲げてきたと語る。

研究チームは2008年、ポラリス（Polaris）と呼ばれる最初のポーカー実行プログラムを完成させた。ポラリスは、2人のプレーヤー勝負のホールデムで人間の一流プレイヤーに勝つことができた。

「この時点で、コンピューターはこの形式のポーカーでは全ての人間より強いプレーヤーとしての地位を確立した」とボーリング氏は言う。

ポラリスがポーカーで人間に勝てることが判明した後、「論理上の次なるステップは（このゲームを）解くことができるかの検討だった」と同氏は続けた。

4800個の中央演算処理装置（CPU）群がゲームを解決するための計算を開始した。「本質的にゲームを解決するという目標に到達するのに2か月あまりの計算を要した」と同氏は話す。

結果は、世界中でプレーされている最も人気の高い形式のポーカーがこれで「本質的に弱解決する」というものだった。これは、人間が一生分プレーしても、統計的有意性を持って打ち負かすのは不可能であることを意味する。

ボーリング氏は、電子メール取材に対し「ゲームを解決する完全な戦略の算出を目指したが、われわれの戦略はゲームを本質的に解決するものにとどまった。これはつまり、戦略がほぼ完璧であるため（人間が一生涯にプレーできるゲーム数に近い）6000万回プレーした後でも、負ける可能性が運によるものか否かさえも区別できないほど非常に小さいことを意味する」と説明した。http://www.afpbb.com/articles/-/3036040

■コンピューター対人間

ゲームで人間を打ち負かしたコンピューターとしては、ポーカーの他にも1994年にボードゲーム「チェッカー」の世界選手権で初めて人間を破ったプログラム「チヌーク（Chinook）」や、1997年に当時のチェス世界チャンピオン、ガルリ・カスパロフ（Garry Kasparov）氏に勝った「ディープ・ブルー（Deep Blue）」などがある。

米コンピューター大手IBMが開発した高性能コンピューター「ワトソン（Watson）」は2011年、米国のクイズ番組「ジョパディ！（Jeopardy !）」で優勝した。

だがポーカーのテキサス・ホールデムは、特に難題であることが判明していた。プレーヤーが2人だけでも、どのカードがすでに相手の手札に入っているかなどの未知の情報が大量にあるからだ。米カーネギーメロン大学（Carnegie Mellon University）のコンピュータ科学者、トゥオマス・サンドホルム（Tuomas Sandholm）氏は、数多くある「不完全情報ゲーム」のなかでも、ポーカーは人工知能（AI）にとっては最大級の挑戦だと、サイエンス誌に同時掲載された解説記事に記している。同氏の説明によると、これらのいわゆる「不完全情報ゲーム」を解決するための一般的手法では、最初にゲーム全体を抽象化して「規模はより小さいが、戦略的に同様なゲームを生成し、均衡発見アルゴリズムで対応可能なサイズにまで縮小する」という。次に、抽象化した各ゲームを解決して均衡または均衡近傍を導き出し、それらの戦略を元のゲームに対応づける。

ゲーム解決への挑戦は、現代社会に進歩をもたらす助けになるかもしれない。ボーリング氏によると、空港検問所の保安体制の強化、沿岸警備パトロールの向上、医療上の決定の改善などに役立つ可能性があるという。このポーカーに利用されたようなアルゴリズムの進歩は、現実世界の不確定性と不明情報を含む状況に対して意思決定を下す場合に、より効果的な解決策を見つける助けになるかもしれないと、論文は結論付けている。(c)AFP/Kerry SHERIDANhttp://www.afpbb.com/articles/-/3036040?pid=0&page=2

再生核研究所声明１９８（2015.1.14）　

計算機と人間の違い、そしてそれらの愚かさについて

まず、簡単な例として、割り算、除算の考えを振り返ろう：

声明は一般向きであるから、本質を分かり易く説明しよう。　そのため、ゼロ以上の数の世界で考え、まず、100/2を次のように考えよう：

100-2-2-2-,...,-2.

ここで、2　を何回引けるか（除けるか）と考え、いまは 50 回引いてゼロになるから分数の商は50である。

次に　3/2　を考えよう。まず、

3 - 2 = 1

で、余り1である。そこで、余り1を10倍して、　同様に

10-2-2-2-2-2=0

であるから、10/2=５　となり

3/2 =１＋０．５＝１．５

とする。３を２つに分ければ、１．５である。

これは筆算で割り算を行うことを　減法の繰り返しで考える方法を示している。

ところで、　除算を引き算の繰り返しで計算する方法は、除算の有効な計算法がなかったので、実際は日本ばかりではなく、中世ヨーロッパでも計算は引き算の繰り返しで計算していたばかりか、現在でも計算機で計算する方法になっていると言う（吉田洋一；零の発見、岩波新書、３４－４３）。

計算機は、上記のように　割り算を引き算の繰り返しで、計算して、何回引けるかで商を計算すると言う。　計算機には、予想や感情、勘が働かないから、機械的に行う必要があり、このような手順、アルゴリズムが必要であると考えられる。　これは計算機の本質的な原理ではないだろうか。

そこで、人間は、ここでどのように行うであろうか。 100/2　の場合は、２掛ける何とかで１００に近いものでと考え　大抵５０は簡単に求まるのでは？　3/2も　３の半分で１．５くらいは直ぐに出るが、　２掛ける１で２、　余り１で、　次は１０割る２で　5そこで、１．５と直ぐに求まるのではないだろうか。

人間は筆算で割り算を行うとき、上記で何回引けるかとは　発想せず、何回を掛け算で、感覚的に何倍入っているか、何倍引けるか、と考えるだろう。この人間の発想は教育によるものか、割り算に対して、逆演算の掛け算の学習効果を活かすように　相当にひとりでに学習するのかは極めて面白い点ではないだろうか。この発想には掛け算についての相当な経験と勘を有していなければ、有効ではない。

この簡単な計算の方法の中に、人間の考え方と計算機の扱いの本質的な違いが現れていると考える。　人間の方法には、逆の考え、すなわち積の考えや、勘、経験、感情が働いて、作業を進める点である。　計算機には柔軟な対応はできず、機械的にアルゴリズムを実行する他はない。　しかしながら、　計算機が使われた、あるいは用意された情報などを蓄積して、どんどんその意味における経験を豊かにして、求める作業を効率化しているのは　広く見られる。　その進め方は、対象、問題によっていろいろなアルゴリズムで　具体的には　複雑であるが、しかし、自動的に確定するように、機械的に定まるようになっていると考えられる　―　厳密に言うと　そうではない考えもできる、すなわち、ランダムないわゆる　乱数を用いるアルゴリズムなどはそうとは言えない面もある　―　グーグル検索など時間と共に変化しているが、自動的に進むシステムが構築されていると考えられる。　それで、蓄積される情報量が人間の器、能力を超えて、計算機は　人間を遥かに超え、凌ぐデータを扱うことが可能である事から、そのような学習能力は、人間のある能力を凌ぐ可能性が高まって来ている。　将棋や碁などで　プロの棋士を凌ぐほどになっているのは、良い例ではないだろうか。もちろん、この観点からも、いろいろな状況に対応するアルゴリズムの開発は、計算機の進化において　大きな人類の課題になるだろう。

他方、例えば、幼児の言葉の学習過程は　神秘的とも言えるもので、個々の単語やその意味を1つずつ学習するよりは　全体的に感覚的に自動的にさえ学習しているようで、学習効果が生命の活動のように柔軟に総合的に進むのが　人間の才能の特徴ではないだろうか。

さらに、いくら情報やデータを集めても、　人間が持っている創造性は　計算機には無理のように見える。　創造性や新しい考えは　無意識から突然湧いてくる場合が多く、　創造性は計算機には無理ではないだろうか。　そのことを意識したわけではないが、人間の尊厳さを　創造性に　纏めている：

再生核研究所声明１８１（2014.11.25）　人類の素晴らしさ　―　７つの視点

そこでも触れているが、信仰や芸術、感情などは生命に結び付く高度な存在で、科学も計算機もいまだ立ち入ることができない世界として、生命に対する尊厳さを確認したい。

しかしながら、他方、人間の驚くべき　愚かさにも自戒して置きたい：

発想の転換、考え方の変更が難しいということである。発想の転換が　天動説を地動説に変えるのが難しかった世界史の事件のように、また、非ユークリッド幾何学を受け入れるのが大変だったように、実は極めて難しい状況がある。人間が如何に予断と偏見に満ち、思い込んだら変えられない性（さが）　が深いことを　絶えず心しておく必要がある：　例えば、ゼロ除算は　千年以上も、不可能であるという烙印のもとで、世界史上でも人類は囚われていたことを述べていると考えられる。世界史の盲点であったと言えるのではないだろうか。　ある時代からの　未来人は　人類が　愚かな争いを続けていた事と同じように、人類の愚かさの象徴　と記録するだろう。　数学では、加、減、そして、積は　何時でも自由にできた、しかしながら、ゼロで割れないという、例外が除法には存在したが、ゼロ除算の簡潔な導入によって、例外なく除算もできるという、例外のない美しい世界が実現できた（再生核研究所声明１８０（2014.11.24）　人類の愚かさ―　７つの視点）。そこで、この弱点を克服する心得を次のように纏めている：

再生核研究所声明191（2014.12.26）　公理系、基本と人間

以　上

再生核研究所

2015年1月29日木曜日

無敵のポーカー・プログラム完成、カナダ研究

0 件のコメント:

コメントを投稿

自己紹介

ブログアーカイブ